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Verfahren zur gentechnischen Veranderung von Organ is men der Gattuna 
Blakeslea. entspre chende Orqanismen und deren Verwenduna 

Die Erfindung betrifft ein Verfahren zur gentechnischen Veranderung von Orga- 
5 nismen der Gattung Blakeslea, entsprechende Orgahismen und deren Verwen- 
. dung. 

Pilze der Gattung Blakeslea sind als Produktionsorganismen bekannt. So wird 
z. B. Blakeslea trispora als Produktionsorganismus fQr p-Carotin (Ciegler, 1965, 

10 Adv Appl Microbiol. 7:1) und Lycopin verwendet (EP 1201762, EP 1184464, 
WO 03/038064). Daneben kommt Blakeslea zur Produktion anderer lipophiier 
Substanzen in Frage wie z.B. andere Carotinoide und deren Vorstufen, 
Phospholipide, Triacylglyceride, Steroide, Wachse, fettldsliche Vitamine; Provi- 
tamine und Cofaktoren Oder zur Produktion hydrophiler Substanzen wie z.B. 

15 EiweiBe, Aminosauren, Nukleotide und wasserlosliche Vitamine, Provitamine 
und Cofaktoren. 

Die hohen Produktivitaten fur p-Carotin und Lycopin machen Blakeslea, insbe- 
sondere Blakeslea trispora attraktiv fur die wirtschaftliche fermentative Herstel- 
20 lung von Carotinoiden und deren Vorstufen. : 

Allerdings ist es auch von Interesse die Produktivitaten der bisher natiirlicher- 
weise produzierten Carotine und deren Vorstufen weiter zu steigem und die 
Herstellung weiterer Carotinoide, wie z. B. Xanthophylle zu ermoglichen, die 
von Blakeslea bisher nicht oder nur in sehr geringem Malie gebildet und isoliert 
werden konnen. 

Carotinoide werden Futtermitteln, Nahmngsmitteln, Nahrungserganzungsmit- 
teln, Kosmetika und Arzneimitteln zugesetzt. Die Carotinoide dienen vor allem 
als Pigmente zur Farbung. Daneben werden die antioxidative Wirkung der Ca- 
rotinoide und andere Eigenschaften dieser Substanzen genutzt. Man unterteilt 
die Carotinoide in die reinen Kohlenwasserstoffe, die Carotine und die sauer- 
stoffhaltigen Kohlenwasserstoffe, die Xanthophylle. Xanthophylle wie Cantha- 
xanthin und Astaxanthin werden beispielsweise zur Pigmentierung von HQhner- 
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eiern und Fischen eingesetzt (Britton et al. 1998, Carotinoids, Vol 3, Biosynthe- 
sis and Metabolism). Die Carotine p-Carotin und Lycopin werden vor allem in 
der Humanernahrung eingesetzt. p-Carotin wird beispielsweise als Getranke- 
farbstoff verwendet. Lycopin hat eine krankheitsvorbeugende Wirkung (Argwal 
und Rao, 2000, CMAJ 163:739-744; Rao und Argwal 1999, Nutrition Research 
19:305^323). Die farblose Carotinoidvorstufe Phytoen kommt vor allem fur An- 
wendungen als Antioxidans in Frage. 

Der Qberwiegende Teil der Carotinoide und deren Vorstufen die als Zusatzstoffe 
fOr die oben genannten Anwendungen eingesetzt werden, wird durch chemi- 
sche Synthese hergestellt. Die chemische Synthese ist mehrstufig, technisch 
sehr aufwendig und verursacht hohe Herstellkosten. Fermentative Verfahren 
sind demgegenOber technisch verhaltnismaBig einfach und basieren auf ko- 
stengOnstigen Einsatzstoffen. Fermentative Verfahren zur Herstellung von Ca- 
rotinoiden kSnnen dann wirtschaftlich attraktiv und wettbewerbsfahig zur chemi- 
schen Synthese sein, wenn die Produktivitat der bisherigen fermentativeri Ver- 
fahren gesteigert wQrde Oder neue Carotinoide auf Basis der bekannten Pro- 
duktionsorganismen hergestellt werden kQnnten. 

Hierzu ist eine gentechnische Veranderurig vori Blakeslea erforderlich. Insbe- 
sondere, wenn Xanthophylle produziert werden sollen, da diese Verbindungen 
natOrlicherweise vom Wildtyp der Blakeslea nicht synthetisiert werden. 

Allerdings sind bisher keine Methoden zur gentechnischen Veranderung von 
Blakeslea, insbesondere Blakeslea trispora bekannt. 

Als Methode zur Herstellung von gentechnischen veranderten Pilzen wurde in 
einigen Fallen die Agrobacterium-vermittelte Transformation erfolgreich einge- 
setzt. So sind z. B. folgende Organismen durch Agrobakterien transformiert 
worden: Saccharomyces cerevisiae (Bundock et al., 1995, EMBO Journal, 
14:3206-3214), Aspergillus awamori, Aspergillus nidulans, Aspergillus niger, 
Colletotrichum gloeosporioides, Fusarium soiani pisi, Neurospora crassa, Tri- 
choderma reesei, Pleurotus dstreatus, Fusarium graminearum (van der Toorreri 
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et al M 1997, EP 870835), Agraricus bisporus, Fusarium venenatum (de Groot et 
al., 1998, Nature Biotechnol. 16:839-842), Mycosphaerella graminicola (Zwiers 
et al. 2001, Curr. Genet. 39:388-393), Glarea lozoyensis (Zhang et al., 2003,. 
Mol. Gen. Genomics 268:645-655), Mucor miehei (Monfort et al. 2003, FEMS 
5 Microbiology Lett. 244:101 -106). 

Von Interesse ist besonders eine homologe Rekombination, bei der zwischen 
der einzufiihrenden DNA und der Zell-DNA moglichst viele Sequenzhomologien 
bestehen, so dass eine ortsspezifische EinfQhrung bzw. Ausschaltung von ge- 
10 netischer Information im Genom des Empfangerorganismus mSgiich ist. An- 
demfalls wird die Spender-DNA durch illegitime bzw. nicht-homologe Rekombi- 
nation ins Genom des Empfangerorganismus integriert, Was nicht ortsspezifisch 
erfolgt. 

15 Eine durch Agrobacterium vermittelte Transformation und anschlieSende homo- 
loge Rekombination der transferierten DNA wurde bisher bei folgenden Orga- 
nismen nachgewiesen: Aspergillus awamori (Gouka et al. 1999, Nature Biotech 
17:598-601), Glarea lozoyensis (Zhang et al., 2003, Mol. Gen. Genomics 
268:645-655), Mycosphaerella graminicola ((Zwiers et al. 2001, Curr. Genet. 

20 39:388-393). 

Als weitere Methode zur Transformation von Pilzen ist die Elektroporation be- 
kannt. Die integrative Transformation von Hefe durch Elektroporation wurde von 
Hill, Nucl. Acids. Res. 17:8011 gezeigt. FOr filamentose Pilze wurde die Trans- 
25 formation durch Chakaborty und Kapoor beschrieben (1990, Nucl. Acids. Res. 
18:6737). 

Eine „biolistische" Methode, d.h. die Obertragung von DNA durch Beschuss yon 
Zellen mit DNA-beladenen Partikeln wurde beispielsweise fur Trichoderma har- 
30 zianum und Gliocladium virens beschrieben (Lorito et al. 1993, Curr. Genet. 
24:349-356). 
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Diese Methoden konnten bisher jedoch nicht erfolgreich zur gezlelten geneti- 
schen Veranderung von Blakeslea und insbesondere Blakeslea trispora einge- 
setzt werden. 

5 Eine besondere Schwierigkeit bei der Herstellung von gezielt genetisch veran- 
derten Blakeslea und Blakeslea trispora, ist die Tatsache, dass deren Zellen in 
alien Stadien des sexuellen und des vegetativen Zellzyklus mehrkernig sind. In 
Sporen von Blakeslea trispora Stamm NRRL2456 und NRRL2457 wurden z. B. 
im Durchschnitt 4,5 Kerne pro Spore nachgewiesen (Metha und Cerda-Olmedo, 

10 1995, Appl. Microbiol. Biotechnol. 42:836-638). Dies hat zur Folge, dass die 
gentechnische Veranderung in aller Regel nur in einem oder wenigen Kernen 
vorliegt, die Zellen also heterokaryotisch sind. 

Sollen die genetisch veranderten Blakeslea-Arten, insbesondere Blakeslea 
15 trispora zur Produktion eingesetzt werden, so ist es insbesondere bei einer 
Gendeletion wichtig, dass in den Produktionsstammen die gentechnische Ver- 
anderung in alien Kernen vorliegt, so dass eine stabile und hohe Syntheselei- 
stung ohne Nebenprodukte moglich wird. Die Stamme mussen folglich in Bezug 
auf die gentechnische Veranderung homokaryotisch sein. 

20 

Lediglich fur Phycomyces blakesleeanus ist ein Verfahren beschrieben worden, 
um homokaryotische Zellen zu erzeugen (Roncero et al.,1984, Mutat. Res. 
125:195). Durch Zugabe des mutagenen Agens MNNG (N-Methyl-N'-nitro-N- 
nitrosoguanidin) werden nach dem dort beschriebenen Verfahren Kerne in den 

25 Zellen eliminiert, so dass statistisch eine gewisse Anzahl von Zellen mit nur 
noch einem funktionellem Kern vorliegt. Die Zellen werden dann einer Selektion 
unterzogen, in der nur einkernige Zellen mit einem rezessiven Selektionsmarker 
zu einem Mycel auswachsen konnen. Die Nachkommen dieser selektierten Zel- 
len sind mehrkernig und homokaryotisch. Ein rezessiver Selektionsmarker fOr 

30 Phycomyces blakesleanus ist z. B. dar. Dar + -Stamme nehmen das toxische 
Riboflavin-Analog 5-Carbon-5-deazariboflavin auf; Dar - Sta.mme dagegen nicht 
(DelbrOck et al. 1979, Genetics 92:27). Die Selektion von rezessiven Mutanten 
erfolgt durch Zugabe von 5-Carbon-5-deazariboflavin (DARF). 
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Allerdings ist dieses Verfahren nicht fur Blakeslea, insbesondere Blakeslea 
trispora bekannt und insbesondere nicht mit im Zusammenhang mit einer 
Transformation beschrieben worden. 

Aufgabe der voriiegenden Erfindung ist es demgegenuber, ein Verfahren be- 
reitzustellen, mit dem eine gentechnische Veranderung von Blakeslea- 
Stammen, insbesondere Blakeslea trispora moglich ist. Dartiber hinaus ist es 
Aufgabe der Erfindung ein Verfahren bereitzustellen, das die Herstellung homo- 
karyotischer genetisch verahderter Stamme erlaubt. Femer ist es eine Aufgabe 
der Erfindung entsprechend gentechnisch veranderte Zellen bereitzustellen. 

Diese Aufgabe wird durch ein Verfahren zur Herstellung eines gentechnisch 
veranderten Organismus der Gattung Blakeslea gelost, umfassend 

(i) Transformation mindestens einer der Zellen, 

(ii) ggf. Homokaryotisierung der aus (i) erhaltenen Zellen durch Eliminie- 
rung von Kemen in diesen Zellen, so dass mindestens eine Zelle mit 
nur einem Kern, verbleibt, der die gewunschte genetische Veranderung 
aus (i) aufweist und zur Auspragung fuhrt, und 

(iii) Selektion der gentechnisch veranderten Zelle oder Zellen. 

Mit der erfindungsgemaflen Methode ist es moglich, mehrkernige Zellen der 
Pilze Blakeslea gezielt und stabil genetisch zu verandem, urn so Mycel aus Zel- 
len mit einheitiichen Kemen zu gewinnen. Vorzugsweise handelt es sich Zellen 
von Pilzeh der Art Blakeslea trispora 

Unter Transformation wird die Obertragung einer genetischen Information in 
den Organismus, insbesondere Pilz verstanden. Darunter sollen alle dem 
Fachmann bekannten Moglichkeiten zur Einschleusung der Information, insbe- 
sondere DNA fallen, z. B. Beschuss mit DNA-beladenen Partikeln, Transforma- 
tion mittels Protoplasten, Mikroinjektion von DNA, Elektroporation, Konjugation 
oder Transformation kompetenter Zellen, Chemikalien oder Agrobakterien ver- 
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mittelte Transformation. AIs genetische Information werden ein Genabschnitt, 
ein Gen oder mehrere Gene verstanden. Die genetische Information kann z. B. 
mit Hilfe eines Vectors oder als freie Nukleinsaure (z. B. DMA, RNA) und auf 
sonstige Weise in die Zellen eingebracht und entweder durch Rekombination 
5 ins Wirtsgenoni eingebaut oder in freier Form in der Zelle voriiegen. Besonders 
bevorzugt ist hierbei die homologe Rekombination. 

Bevorzugte Transformationsmethode ist die Agrobacterium tumefaciens- 
vermittelte Transformation. Hierzu wird zunachst die zu transferierende Spen- 

10 der-DNA in einen Vektor eingefugt, der (i) flankierend zu der zu transferieren- 
den DNA die T-DNA-Enden tragt, der (ii) einen Selektionsmarker enthalt und 
der (iii) ggf. Promotoren und Terminatoren fOr die Genexpression der Spender- 
DNA aufweist. Dieser Vektor wird in einen Agrobacterium-tumefaciens-Stamm 
ubertragen, der ein Ti-Plasmid mit den vir-Genen enthalt. vir-Gene sind fur den 

15 DNA-Transfer in Blakeslea verantwortlich. Mit diesem Zwei-Vektor-System wird 
die DNA von Agrobacterium in Blakeslea Gbertragen. Hierzu werden die Agro- 
bakterien zunachst in Gegenwart von Acetosyringohe inkubiert. Acetosyringone 
induziert die vir-Gene. AnschlieBend werden Sporen von Blakeslea trispora zu- 
sammen mit den induzierten Zeilen von Agrobacterium tumefaciens auf Aceto- 

20 syringone-haltigem Medium inkubiert und dann auf Medium ubertragen, das 
eine Selektion der Transformanten, d.h. der gentechnisch veranderten Stamme 
von Blakeslea ermbglicht. 

25 Der Begriff Vector wird in der vorliegenden Anmeldung als eine Bezeichnung fur 
ein DNA-Molekul verwehdet, das zum Einschleusen und ggf. zur Vermehrung 
von Fremd-DNA in eine Zelle dient (siehe auch 'Vector" in Rompp Lexikon 
Chemie - CDROM Version 2.0, Stuttgart/New York: Georg Thieme. Verlag 
1999). In der vorliegenden Anmeldung sollen unter dem begriff "Vector" auch 

30 Plasmide, Cosmide usw. verstanden werden, die dem gleichen Zweck dienen. 

Unter Expression wird in der vorliegenden. Anmeldung die Obertragung einer 
genetischen Information ausgehend von DNA oder RNA in ein Gen-Produkt 
(hier vorzugsweise Carotinoide) verstanden und soli auch den Begriff der Ober- 
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expression beinhalten, womit eine verstarkte Expression gemeint ist, so dass 
das ein bereits in der nicht transformierten Zelle (Wildtyp) hergestelltes Produkt 
verstarkt produziert wird Oder einen grofien Teil des gesamten Gehaltes der 
Zelle ausmacht. 

Unter gentechnischer Veranderung soil die Einschleusung genetischer Informa- 
tion in einen Empfangerorganismus, so dass diese stabil exprimiert und bei der 
Zellteilung weitergegeben wird,. verstanden werden. In diesem Zusammenhang 
ist die Homokaryotisierung, die Herstellung von Zellen, die nur einheitliche Ker- 
ne enthalten, d. h. Kerne mit gleichem genetischem Informationsgehalt. 

Diese Homokaryotisierung ist nur notwendig, wenn die durch Transformation 
eingefuhrte genetische Information rezessiv vorliegt, d. h. nicht zur Auspragung 
gelangt. FQhrt die Transformation aber zu einem dominanten Vorliegen der ge- 
netischen Information, d. h. wird sie ausgepragt, so ist eine Homokaryotisierung 
nicht unbedingt notig. Vorzugsweise wird zur Homokaryotisierung ein mutage- 
nes Agens eingesetzt, wobei es sich insbesondere urn N-Methyl-N'-nitro- 
nitrosoguanidin (MNNG) handelt. 

Unter Selektion wird die Auswahl von Zellen verstanden, deren Kerne dieselbe 
genetische Information beinhalten, d. h. Zellen die die gieichen Eigenschaften 
aufweisen, wie Resistenzen oder die Herstellung bzw. vermehrte Herstellung 
eines Produktes. In der Selektion werden bevorzugt 5-Carbon-5-deazariboflavin 
(darf) und Hygromycin (hyg) eingesetzt. 

Der in der Transformation (i) eingesetzte Vector kann derart gestaltet sein, dass 
die im Vector enthaltene genetische Information in das Genom mindestens ei- 
ner Zelle integriert wird. Dabei kann genetische Information in der Zelle ausge- 
schaltet werden. 

Der in der transformation (i) eingesetzte Vector kann aber auch derart ausge- 
staltet sein, dass die im Vector enthaltene genetische Information in der Zelle 
exprimiert wird, d. h. genetische Information eingefugt wird, die im korrespon- 
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dierenden Wildtyp nicht vorhanden ist oder die durch die Transformation ver- 
starkt bzw. uberexprimiert wird. 

Der Vector kann beliebige genetische Informationen zur genetischen Verande- 
rungen von Organismen der Gattung Blakeslea enthalten. 

Unter „gentetischer Information" werden vorzugsweise Nukleinsaureri verstan- 
den, deren Einbringung in den Organismus der Gattung Blakeslea zu einer gen- 
tischen Veranderung in Organismen der Gattung Blakeslea, also beispielsweise 
zu einer Verursachung, Erhbhung oder Reduzierung von Enzymaktivitaten im 
Vergleich zum Ausgangsorganismus fuhren. 

Der Vector kann beispielsweise genetische Information zur Hersteliung iipophi- 
ler Substanzen enthalten wie z.B. Carotinoide und deren Vorstufen, Phospholi- 
pide. Triacylglyceride, Steroide, Wachse, fettlosliche Vitamine, Provitarnine und 
Cofaktoren oder genetische Information zur Hersteliung hydrophiler Substanzen 
wie z.B. EiweiBe, Aminosauren, Nukleotide und wasserlSsliche Vitaminen, Pro- 
vitarnine und Cofaktoren. 

Bevorzugterweise enthalt der eingesetzte Vector genetische Informationen zur 
Hersteliung von Carotinoiden oder Xanthophyllen oder deren Vorstufen. 

Besonders bevorzugt sind genetische Informationen zur Hersteliung von Asta- 
xanthin, Zeaxanthin, Echinenon, p-Cryptoxanthin, Andonixanthin, Adonirubin, 
Canthaxanthin, 3- und 3'-Hydroxyechinenon, Lycopin, Lutein, p-Carotin oder 
Phytoen. Ganz besonders bevorzugt sind genetische Informationen zur Herstel- 
iung von Phytoen, Astaxanthin oder Zeaxanthin. 

In einer bevprzugten AusfUhrungsform werden die Organismen der Gattung 
Blakeslea beispielsweise dadurch in die Lage versetzt Xanthophylle, wie bei- 
spielsweise Canthaxanthin, Zeaxanthin oder Astaxanthin herzustellen, indem in 
den genetisch veranderten Organismen der Gattung Blakeslea im Vergleich 
zum Wildtyp eine Hydroxylase-Aktivitat und/oder Ketolase-Aktivitat verursacht 
wird. 
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Unter Ketolase-Aktiyitat wird die Enzymaktivitat einer Ketolase verstanden. 

Unter einer Ketolase wird ein Protein verstanden, das die enzymatische Aktivi- 
tat aufweist, am, gegebenenfalls substituierten, p-lonon-Ring von Carotinoiden 
eine Keto-Gruppe einzufuhren. 

Insbesondere wird unter einer Ketolase ein Protein verstanden, das 
die enzymatische Aktivitat aufweist, p-Carotin in Canthaxanthin umzuwandeln. 

Dementsprechend wird unter Ketolase-Aktivitat die in einer bestimmten Zeit 
durch das Protein Ketolase umgesetzte Menge p-Carotin bzw. gebildete Menge 
Canthaxanthin verstanden. 

Unter dem Begriff "Wildtyp" wird erfindungsgemaB der entsprechende nicht ge- 
netisch veranderte Ausgangsorganismus der Gattung Blakesleaa verstanden. 

Je nach Zusammenhang kann unter dem Begriff "Organismus" der Ausgangs- 
organismus (Wildtyp) der Gattung Blakesleaa Oder ejn erfindungsgemalJer, ge- 
netisch veranderter Organismus der Gattung Blakesleaa oder beides verstan- 
den werden. 

Vorzugsweise wird unter "Wildtyp" fur die Verursachung der Ketolase-Aktivitat 
und fOr die Verursachung der Hydroxylase-Aktivitat jeweils ein Referenzorga- 
nismus verstanden. 

Dieser Referenzorganismus der Gattung Blakesleaa ist Blakeslea trispora 
ATCC 14271. 

Die Bestimmung der Ketolase-Aktivitat in erfindungsgemallen genetisch veran- 
derten Organismen der Gattung Blakesleaa und in Wildtyp- bzw. Referenzorga- 
nismen erfolgt vorzugsweise unter folgenden Bedingungen: 
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Die Bestimmung der Ketolase-Aktivitat in Organismen der Gattung Blakeslea 
erfolgt in Anlehnung an die Methpde von Frazer et al., (J. Biol. Chem. 272(10): 
6128-6135, 1997). Die Ketolase-Aktivitat in Extrakten wird mit den Substrateh 
beta-Carotin und Canthaxanthin in Gegenwart von Lipid (Sojalecithin) und De- 
5 tergens (Natriumcholat) bestimmt. Substrat/Produkt-Verhaltnisse aus den Keto- 
lase-Assays werden mittels HPLC ermittelt. 

Der erfindungsgema&e genetisch veranderte Organismus der Gattung Blakes- 
leaa weist in dieser, bevorzugten AusfQhrungsform im Vergleich zum genetisch 
10 nicht veranderten Wildtyp eine Ketolase-Aktivitat auf und ist somit vorzugsweise 
in der Lage, transgen eine Ketolasezu exprimieren. 

In einer weiter bevorzugten AusfOhrungsform erfolgt die Verursachung der 
Ketolase-Aktivitat in den Organismen der Gattung Blakesleaa durch 
15 Genexpression einer Nukleinsaure kodierend eine Ketolase. 

In dieser bevorzugten Ausfuhrungsform erfolgt die Verursachung der Genex- 
pression einer Nukleinsaure kodierend eine Ketolase vorzugsweise durch Ein- 
bringen von Mukleinsauren, die Ketolasen kodieren in die Ausgangsorganismus 
20 der Gattung Blakesleaa. 

Dazu kann prinzipiell jedes Ketolase-Gen, also jede Nukleinsauren die eine 
Ketolase codiert verwendet werden. 

25 Alle in der Beschreibung erwahnten Nukleinsauren konnen beispielsweise eine 
RNA-, DNA- oder cDNA-Sequenz sein. 

Bei genomischen Ketolase-Sequenzen aus eukaryontischen Quellen, die In- 
trons enthalten, sind fur den Fall das der Wirtsorganismus der Gattung Blakes- 
30 leaa nicht in der Lage ist oder nicht in die Lage versetzt werden kann, die ent- 
sprechenden Ketolase zu exprimieren, bevorzugt bereits prozessierte Nuklein- 
sauresequenzen, wie die entsprechenden cDNAs zu verwenden. 
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Beispiele fur Nukleinsauren, kodierend eine Ketolase und die entsprechenden 
Ketolasen, die im erfindungsgemaUen Verfahren verwendet werden konnen 
sind beispielsweise Sequenzen aus: 

Haematoccus pluvialis, insbesondere aus Haematoccus pluvialis Flotow em. 
Wille (Accession NO: X86782; Nukleinsaure: SEQ ID NO: 11, Protein SEQ ID 
NO: 12), 

Haematoccus pluvialis, NIES-144 (Accession NO: D45881; Nukleinsaure: SEQ 
ID NO: 13, Protein SEQ ID NO: 14), 

Agrobacterium aurantiacum (Accession NO: D58420; Nukleinsaure: SEQ ID 
NO: 15, Protein SEQ ID NO: 16), 

Alicaligenes spec. (Accession NO: D58422; Nukleinsaure: SEQ ID NO: 17, 
Protein SEQ ID NO: 18), 

Paracoccus marcusii (Accession NO: Y15112; Nukleinsaure: SEQ ID NO: 19, 
Protein SEQ ID -NO: 20). 

Synechocystis sp: Strain PC6803 (Accession NO: NP442491 ; Nukleinsaure: 
SEQ ID NO: 21 , Protein SEQ ID NO: 22). 

Bradyrhizobium sp. (Accession NO: AF218415; Nukleinsaure: SEQ ID NO: 23, 
Protein SEQ ID NO: 24). 

Nostoc sp. Strain PCC7120 (Accession NO: AP003592, BAB74888; Nuklein- 
saure: SEQ ID NO: 25, Protein SEQ ID NO: 26), 

C ■ ■ 

Nostoc punctiforme ATTC 29133, Nukleinsaure: Acc.-No. NZ_AABC01000195, 

Basenpaar 55,604 bis 55,392 (SEQ ID NO: 27); Protein: Acc.-No. 

ZP_001 11258 (SEQ ID NO: 28) (als putatives Protein annotiert), 
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Nostoc punctiforme ATTC 29133, Nukleinsaure: Acc.-No. NZ_AABC0 10001 96, 
Basenpaar 140,571 bis 1391810 (SEQ ID NO: 29), Protein: (SEQ ID NO: 30) 
(nicht annotiert). 

5 Weitere naturiiche Belspiele fur Ketolasen und Ketolase— Gene, die im erfin- 
dungsgemalien Verfahren verwendet werden konnen, lassen sich beispielswei- 
se aus verschiedenen Organismen, deren genomische Sequenz bekannt ist, 
durch Identitatsvergleiche der Aminosauresequenzen Oder der entsprechenden 
ruckfibersetzten Nukleinsauresequenzen aus Datenbanken mlt den vorstehend 
10 beschriebenen Sequenzen und insbesondere mit den Sequenzen SEQ ID NO: 
12 und/oder 26 leicht auffinden. 

Weitere naturiiche Beispiele fur Ketolasen und Ketolase-Gene lassen sich wei- 
terhin ausgehend von den vorstehend beschriebenen Nukleinsauresequenzen, 
15 insbesondere ausgehend von den Sequenzen SEQ ID NO: 12 und/oder 26 aus 
verschiedenen Organismen, deren genomische Sequenz nicht bekannt ist, 
durch Hybridisierungstechniken in an sich bekannter Weise leicht auffinden. 

Die Hybridisierung kann unter moderaten (geringe Stringenz) oder vorzugswei- 
20 se unter stringenten (hohe Stringenz) Bedingungen erfolgen. 

Solche Hybridisierungsbedingungen sind beispielsweise bei Sambrook, J., 
Fritsch, E.F., Maniatis, T., in: Molecular Cloning (A Laboratory Manual), 2. Auf- 
lage, Cold Spring Harbor Laboratory Press, 1989, Seiten 9.31-9.57 oder in Cur- 
25 rent Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6 
beschrieben. 

Beispielhaft konnen die Bedingungen wahrend des Waschschrittes ausgewahlt 
sein aus dem Bereich von Bedingungen begrenzt von solchen mit geringer 
30 Stringenz (mit 2X SSC bei 50°C) und solchen mit hoher Stringenz (mit 0.2X 
SSC bei 50°C, bevorzugt bei 65°C) (20X SSC: 0,3 M Natriumcitrat, 3 M Natri- 
umchlorid, pH 7.0). 
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Daruberhinausfcann die Temperatur.wahrend des Waschschrittes von modera- 
ten Bedinguhgen bei Raumtemperatur, 22°C, bis zu stringenten Bedingungen 
bei 65°C angehoben werden. 

5 Beide Parameter, Salzkohzentration und Temperatur, konnen gleichzeitig vari- 
iert werden, auch kann eiher der beiden Parameter konstant gehalten und nur 
der andere variiert werden. Wahrend der Hybridisierung konnen auch denatu- 
rierende Agenzien wie zum Beispiel Formamid oder SDS eingesetzt werden. In 
Gegenwart von 50 % Formamid wird die Hybridisierung bevorzugt bei 42°C 
10 ausgefuhrt. 

Einige beispielhafte Bedingungen fur Hybridisierung und Waschschritt sind in- 
folge gegeben: 

15 (1) Hybridiserungsbedingungen mit zum Beispiel 

(i) 4X SSC bei 65°C, Oder 

(ii) 6X SSC bei 45°C, oder • 

(iii) 6X SSC bei 68°C, 1 00 mg/ml denaturierter Fischsperma-DNA, oder 

(iv) 6X SSC, 0.5 % SDS, 100 mg/ml denaturierte, fragmentierte Lachssper- 
20 ma-DNA bei 68°C, oder 

(v) 6XSSC, 0.5 % SDS, 100 mg/ml denaturierte, fragmentierte Lachssper- 
ma-DNA, 50 % Formamid bei 42°C, oder 

(vi) 50 % Formamid, 4X SSC bei 42°C, oder 

(vii) 50 % (vol/vol) Formamid, 0.1 % Rinderserumalbumin, 0.1 % Ficoll, 0.1 %. 
25 Polyvinylpyrrolidon, 50 mM Natriumphosphatpuffer pH 6.5, 750 mM NaCI, 75 

mM Natriumcitrat bei 42°C, oder 

(viii) 2X oder 4X SSC bei 50°C (moderate Bedingungen), oder 

(ix) 30 bis 40 % Formamid, 2X oder 4X SSC bei 42°C (moderate Bedingun- 



30 



gen). 



(2) Waschschritte fur jeweils 1 0 Minuten mit zum Beispiel 

(i) 0,015 M NaCI/0.0015 M Natriumcitrat/0.1 % SDS bei 50°C, oder 

(ii) 0.1X SSC bei 65°C, oder 
0.1X SSC, 0.5 % SDS bei 68°C, oder 
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(iv) 0.1X SSC, 0.5 % SDS, 5Q % Formamid bei 42°C, oder 

(v) 0.2X SSC, 0.1 % SDS bei.42°C, oder 

(vi) 2X SSC bei 65°C (moderate Bedingungen). 

In einer bevorzugten AusfOhrungsform der erfindungsgemaRen genetisch ver- 
anderten Organismen der Gattung Biakesiea bringt man Nukleinsauren ein, die 
ein Protein kodieren, enthaitend die Aminosauresequenz SEQ ID NO: 12 oder 
eine von dieser Sequenz durch Substitution, Insertion oder Deletion von Amino- 
sauren abgeleitete Sequenz, die eine Identitat von mindestens 20 %, vorzugs- 
weise mindestens 30 %, bevorzugter mindestens 40 %, bevorzugter minde- 
stens 50 %, bevorzugter mindestens 60 %, bevorzugter mindestens 70 %, be- 
vorzugter mindestens 80 %, besonders bevorzugt mindestens 90 % auf Amino- 
saureebene mit der Sequenz SEQ ID NO: 12 und die enzymatische Eigenschaft 
einer Ketolase aufWeist. 

Dabei kann es sich urn eine naturliche Ketolase-Sequenz handeln, die wie vor- 
stehend beschrieben durch Identitatsvergieich der Sequenzen aus anderen Or- 
ganismen gefunden werden kann oder urn eine kQnstliche Ketolase-Sequenz 
die ausgehend von der Sequenz SEQ ID NO: 12 durch kQnstliche Variation, 
beispielsweise durch Substitution, Insertion oder Deletion von Aminosauren 
abgewandelt wurde. . 

In einer weiteren, bevorzugten Ausfuhrungsform der erfindungsgemSlien Ver- 
fahren bringt man Nukleinsauren ein die ein Protein kodieren, enthaitend die 
Aminosauresequenz SEQ ID NO: 26 oder eine von -dieser Sequenz durch Sub- 
stitution, Insertion oder Deletion von Aminosauren abgeleitete Sequenz, 
die eine Identitat von mindestens 20 %, vorzugsweise mindestens 30 %, bevor- 
zugter mindestens 40 %, bevorzugter mindestens 50 %, bevorzugter minde- 
stens 60 %, bevorzugter mindestens 70 %, bevorzugter mindestens 80 %, be- 
sonders bevorzugt mindestens 90 % auf Aminosaureebene mit der Sequenz 
SEQ ID NO: 26 und die enzymatische Eigenschaft einer Ketolase aufweist. 

Dabei kann es sich um eine naturliche Ketolase-Sequenz handeln, die, wie vor- 
stehend beschrieben, durch Identitatsvergieich der Sequenzen aus anderen 
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Organismen gefunden werden kann Oder urn eine kOnstliche Ketolase-Sequenz 
die ausgehend von der Sequenz SEQ ID NO: 26 durch kOnstliche Variation, 
beispielsweise durch Substitution, Insertion oder Deletion von Aminosauren 
abgewandelt wurde. 

Unter dem Begriff "Substitution" ist in der Beschreibung der Austausch einer 
oder mehrerer Aminosauren durch eine oder mehrere Aminosauren zu veFste- 
hen. Bevorzugt werden sog. konservative Austausche durchgefuhrt, bei denen 
die ersetzte Aminosaure eine ahnliche Eigenschaft hat wie die ursprungliche 
Aminosaure, beispielsweise Austausch von Glu- durch Asp, Gin durch Asn, 
Val durch lie, Leu durch lie, Ser durch Thr. 

Deletion ist das Ersetzen einer Aminosaure durch eine direkte Bindung. Bevor- 
zugte Positionen fur Deletionen sind die Termini des Polypeptids und die Ver- 
knupfungen zwischen den einzelnen Proteindomanen. 

Insertionen sind Einfugungen von Aminosauren in die Polypeptidkette, wobei 
formal eine direkte Bindung durch ein oder mehrere Aminosauren ersetzt.wird. 

Unter Identitat zwischen zwei Proteinen wird die Identitat der Aminosauren uber 
die jeweils gesamte ProteinlSnge verstanden, insbesondere die Identitat 
die durch Vergleich mit Hilfe der Lasergene Software der Firma DNASTAR, inc. 
Madison, Wisconsin (USA) unter Anwendung der Clustal Methode (Higgins DG, 
Sharp PM. Fast and sensitive multiple sequence alignments on a microcompu- 
ter. Comput Appl. Biosci. 1989 Apr;5(2):151-1) unter Einsteliung folgender Pa- 
rameter berechnet wird: 

Multiple alignment parameter: 
Gap penalty 10 
Gap length penalty 10 
Pairwise alignment parameter 
K-tuple 1 
Gap penalty . 3 

Window 5 
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Diagonals saved • • •5 

Unter einern Protein, das. eine Identitat von mindestens 20% 
auf Aminosaureebene mit der Sequenz SEQ ID NO: 12 oder 26 aufweist, 
wird dementsprechend ein Protein verstanden, das bei einem Vergleich seiner 
Sequenz mit der Sequenz SEQ ID NO: 12 oder 26, insbesondere nach obigen 
Programmlogarithmus mit obigem Parametersatz eine Identitat von mindestens 
.20 % aufweist. 

Geeignete Nukleinsauresequenzen sind beispielsweise durch RuckQbersetzung 
der Polypeptidsequenz gemaft dem genetischen Code erhaltlich. 

Bevorzugt werden dafur solche Codons verwendet, die entsprechend der Bla- 
kesleaaspezifischen codon usage haufig verwendet werden. Die codon usage 
lasst sich anhand von Computerauswertungen anderer, bekannter Gene von 
Organismen der Gattung Blakesleaa leicht ermitteln. 

In einer besonders bevorzugten Ausfuhrungsform bringt man eine Nukleinsau- 
re, enthaltend die Sequenz SEQ ID NO: 11 in die Organisrnus der Gattung ein. 

In einer weiteren, besonders bevorzugten Ausfuhrungsform bringt man eine 
Nukleinsaure, enthaltend die Sequenz SEQ ID NO: 25 in die Organisrnus der 
Gattung ein. 

Alle vorstehend erwahnten Ketolase-Gene sind weiterhin in an sich bekannter 
Weise durch chemische Synthese aus den Nukleotidbausteinen wie beispiels- 
weise durch Fragmentkondensation einzelner Qberlappender, komplementarer 
Nukleinsaurebausteine der Doppelhelix herstellbar. Die chemische Synthese 
von Oligonukleotiden kann beispielsweise, in bekannter Weise, nach der 
Phosphoamiditmethode (Voet, Voet, 2. Auflage, Wiley Press New York, S. 896- 
897) erfolgen. Die Anlagerung synthetischer Oligonukleotide und Auffullen von 
Lucken mithilfe des Klenow-Fragmentes der DNA-Polymerase und Ligations- 
reaktionen sowie allgemeine Klonierungsverfahren werden in Sambrook et al. 
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(1989), Molecular cloning: A laboratory manual, Cold Spring Harbor Laboratory 
Press, beschrieben. 



Unter Hydroxylase-Aktivitat die Enzymaktivitat einer Hydroxylase veretanden. 

Unter einer Hydroxylase wird ein Protein verstanden, das die enzymatische Ak- 
tivitat aufweist, am, gegebenenfalls substituierten, 0-lonon-Ring von Carotinoi- 
den eine Hydroxy-Gruppe einzufuhren. 

Insbesondere wird unter einer Hydroxylase ein Protein verstanden, das 
die enzymatische Aktivitat aufweist, P-Carotin in Zeaxanthin oder Cantaxanthin 
in Astaxanthin umzuwahdein. 

15 Dementsprechend wird unter Hydroxyase-Aktivitat die in einer bestimmten Zeit 
durch das Protein Hydroxylase umgesetzte Menge p-Carotin oder Cantaxanthin 
bzw. gebildete Menge Zeaxanthin oder Astaxanthin verstanden. 

Bei einer erh5hten Hydroxylase-Aktivitat gegenQber dem Wildtyp wird somit im 
20 Vergleich zum Wildtyp in einer bestimmten Zeit durch das Protein Hydroxylase 
die umgesetzte Menge P-Carotin oder Cantaxantin bzw. die gebildete Menge 
Zeaxanthin oder Astaxanthin erhoht. 

Vorzugsweise betragt diese ErhShung der Hydroxylase-Aktivitat mindestens 
25 5 %, weiter bevorzugt mindestens 20 %, weiter bevorzugt mindestens 50 %, 
weiter bevorzugt mindestens 100 %, bevorzugter mindestens 300 %, noch be- 
vorzugter mindestens 500 %, insbesondere mindestens 600 % der Hydroxyla- 
se-Aktivitat des Wildtyps. 



30 



Die Bestimmung der Hydroxylase-Aktivitat in erfindungsgemafien genetisch 
veranderten Organismen und in Wildtyp- bzw. Referenz-Organismen erfolgt 
vorzugsweise unter folgenden Bedingungen: 



/ 

t . 

BASF AG 18 . 4. September 2003 

BASF NAE 597/03* 

Die Aktivltat der Hydroxylase wird nach Bouvier et al. (Biochim. Biophys. Acta 
1391 (1998), 320^328) in vitro bestimmt. Es wird zu einer bestimmten Menge an 
Organismenextrakt Ferredoxin, Ferredoxin-NADP Oxidoreductase, Katalase, 
NADPH sowie beta-Carotin mlt Mono- und Digalaktosylglyzeriden zugegeben, 

Besonders bevorzugt erfolgt die Bestimmung der Hydroxylase-Aktivitat unter 
folgenden Bedingungen nach Bouvier, Keller, d'Harlingue und Camara (Xan- 
thophyll biosynthesis: molecular and functional characterization of carotenoid 
hydroxylases from pepper fruits (Capsicum annuum L; Biochim. Biophys. Acta 
1391 (1998), 320-328): 

Der in-vitro Assay wird in einem Volumen von 0.250 ml Volumen durchgefuhrt 
Der Ansatz enthSIt 50 mM Kaliumphosphat (pH.7.6), 0.025 mg Ferredoxin von 
Spinat, 0.5 Einheiten Ferredoxin-NADP+ Oxidoreduktase von Spinat, 0.25 mM 
NADPH, 0,010 mg beta-Carotin (in 0.1 mg Tween 80 emulgiert), 0.05 mM einer 
Mischung von Mono- und Digalaktosylglyzeriden (1:1), 1 Einheit Katalyse, 200 
Mono- und Digglaktosylgfyzeriden, (1:1), 0.2 mg Rinderserumalbumin und Or- 
ganismenextrakt in unterschiedlichem Volumen. Die Reaktionsmischung wird 2 
Stunden bei 30C inkubiert. Die Reaktionsprodukte werden mit organischem L6- 
sungsmittel wie Aceton oder Chloroform/Methanol (2:1) extrahiert und mittels 
HPLCbestimmt 

Besonders bevorzugt erfolgt die Bestimmung der Hydroxylase-Aktivitat unter 
folgenden Bedingungen nach Bouvier, d'Harlingue und Camara (Molecular Ana- 
lysis of carotenoid cyciae inhibition; Arch. Biochem. Biophys. 346(1) (1997) 53- 
64): 

Der in-vitro Assay wird in einem Volumen yon 250 Dl Volumen durchgefuhrt. 
Der Ansatz enthSIt 50 mM Kaliumphosphat (pH 7.6),unterschiedliche Mengen 
an Organismenextrakt, 20 nM Lycopin, 250 Dg an chromoplastidarem Stroma- 
protein aus Paprika, 0.2 mM NADP+, 0.2 mM NADPH und 1 mM ATP. 
NADP/NADPH und ATP werden in 10 ml Ethanol mit 1 mg Tween 80 unmittel- 
bar vor der Zugabe zum Inkubationsmedium gelSst. Nach einer Reaktionszeit 
yon 60 Minuten bei 30C wird die Reaktion diirch Zugabe von Chloro- 
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form/Methanol (2:1) beendet. Die in Chloroform extrahierten Reaktionspfodukte 
werden mittels HPLC analysiert. 

Ein altemativer Assay mit radioaktivem Substrat ist beschrieben in Fraser und 
Sandmann (Biochem. Biophys. Res. Comm. 185(1) (1992) 9-15). 

Die Erhdhung der Hydroxylase-Aktivitat kann durch verschiedene Wege erfbl- 
gen, beispielsweise durch Ausschalten von hemmenden Regulationsmecha- 
nismen auf Expressions- und Proteinebene oder durch Erhohung der Genex- 
pression von Nukleinsauren kodierend eine Hydroxylase gegenOber dem Wild- 

typ. 

Die Erhohung der Genexpression der Nukleinsauren kodierend eine Hydroxyla- 
se gegenQber dem Wildtyp kann ebenfalls durch verschiedene Wege erfolgen, 
beispielsweise durch Induzierung des Hydroxylase-Gens durch Aktivatoren p- 
der durch Einbringen von einer oder mehrerer Hydroxylase-Genkopien, aiso 
durch Einbringen mindestens einer NukleirisSure kodierend eine Hydroxylase in 
denb Organismus der Gattung Blakesleaa. 

In einer bevorzugten Ausfuhrungsform erfolgt die ErhShung der. Genexpression 
einer Nukleinsaure kodierend eine Hydroxylase durch Einbringen von minde- 
stens einer Nukleinsaure kodierend eine Hydroxylase in den Organismus der 
Gattung Blakesleaa. 

Dazu kann prinzipiell jedes Hydroxylase-Gen, also jede Nukleinsaure, die eine 
Hydroxylase und jede Nukleinsaure, die eine (5-Cyclase codiert, verwendet wer- 
den. 

Bei genomischen Hydroxylase-Sequenzen aus eukaryontischen Quellen, die 
Introns enthalten, sind fur den Fall das der WirtsOrganismus nicht in der Lage 
ist oder nicht in die Lage versetzt werden kann, die entsprechende Hydroxylase 
zu exprimieren, bevorzugt bereits prozessierte Nukleinsauresequenzen., wie die 
entsprechenden cDNAs zu verwenden. 
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Ein Beispiel fur ein Hydroxylase-Gen ist eine Nukleinsaure, kodierend eine Hy- 
droxylase aus Haematococcus pluvialis, Accession AX038729, WO 0061764); 
(Nukleinsaure: SEQ ID NO: 31 , Protein: SEQ ID NO: 32). 

5 sowie Hydroxylasen der folgenden Accession Nummern: 

|emb|CAB55626.1, CAA70427.1, CAA70888.1, CAB55625.1, AF499108_1, 
AF315289_1, AF296158JI, AAC49443.1, NP_194300.1, NP_200070.1, 
AAG10430.1, CAC06712.1, AAM88619.1, CAC95130.1, AAL80006.1, 
10 AF162276_1, AA053295.1, AAN85601.1, CRTZ_ERWHE, CRTZ_PAN AN , 
BAB7960.5.1., CRTZ_ALCSP, CRTZ_AGRAU, CAB56060.1, ZP_000 94836.1, 
AAC44852.1, BAC77670.1, NP_745389.1, NP_344225.1, NP_849490.1, 
ZP_00087019.1, NP_503072.1, NP_852012.1, NP_1 15929.1, ZP_00013255.1 

15 In den erfindungsgemaiien bevorzugten transgenen Organismen der Gattung 
Blakeslea iiegt also in dieser bevorzugten Ausfuhrungsform gegenuber dem 
Wildtyp mindestens ein weiteres Hydroxylase-Gen vor. 

In. dieser bevorzugten Ausfuhrungsform weist die genetisch verSnderte Orga- 
20 nismus beispielsweise mindestens eine exogene Nukleinsaure, kodierend eine 
Hydroxylase Oder mindestens zwei endogene Nukleinsauren, kodierend eine. 
Hydroxylase auf. 

Bevorzugt verwendet man in vorstehend beschriebener bevorzugter AusfOh- 
25 rungsform als Hydroxylase-Gene Nukleinsauren, die Proteine kodieren, enthal- 
tend die Aminosauresequenz SEQ ID NO: 32 oder eine von dieser Sequenz 
durch Substitution, Insertion Oder Deletion von Aminosauren abgeleltete Se- 
quenz, die eine. Identitat von mindestens 30 %, vorzugsweise mindestens 50 %, 
bevorzugter mindestens 70%, noch bevorzugter mindestens 90 %, am bevor- 
30 ziigtesten mindestens 95 % auf Aminosaureebene mit der Sequenz SEQ. ID. 
NO: 32, und die die enzymatische Eigenschaft einer Hydroxylase aufweisen. 

Weitere Beispiele fOr Hydroxylasen und Hydroxylase-Gene lassen sich bei- 
spielsweise aus verschiedenen Organismen, deren genomische Sequenz be- 
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kannt ist, wie vorstehend beschrieben, durch Homologievergleiche der Amino- 
sauresequenzen oder der entsprechenden ruckubersetzten Nukleinsaurese- 
quenzen ays Datenbanken mit der SeQ ID. NO: 32 leicht auffinden. 

Weitere Beispiele fur Hydroxylasen und Hydroxylase-Gene lassen sich weiter- 
hin beispielsweise ausgehend von der Sequenz SEQ ID NO: 31 aus verschie- 
denen Organismen deren genomische Sequenz nicht bekannt ist, wie vorste- 
hend beschrieben, durch Hybridisierungs- und PCR-Techniken in an sich be- 
kannter Weise leicht auffinden. 

In einer welter besonders bevorzugten Ausfuhrungsform werden zur ErhQhung 
der Hydroxylase-Aktivitat Nukleinsauren in Organismen eingebracht, die Protei- 
ne kodieren, enthaltend die Aminosauresequenz der Hydroxylase der Sequenz 
SEQ ID NO: 32. 

Geeignete Nukleinsauresequenzen sind beispielsweise durch Riickubersetzung 
der Polypeptidsequenz gemSli dem genetischen Code erhaltlich. 

Bevorzugt werden dafQr solche Codons verwendet, die entsprechend der Orga- 
nismenspezifischen codon usage hSufig verwendet werden. Die codon usage 
lasst sich anhand von Computerauswertungen anderer, bekannter Gene der 
betreffenden Organismen leicht ermitteln. 

In einer besonders bevorzugten Ausfuhrungsform bringt man eine Nukleinsau- 
re, enthaltend die Sequenz SEQ. ID. NO: 31 in den Organismus ein. 

Alle vorstehend erwahnten Hydroxylase-Gene sind weiterhin in an sich bekann- 
ter Weise durch chemische Synthese aus den Nukleotidbausteinen wie bei- 
spielsweise durch Fragmentkondensation einzelner uberiappender, komple- 
mentarer Nukieinsaurebausteine der Doppelhelix herstellbar. Die chemische 
Synthese von Oligonukleotiden kann beispielsweise, in bekannter Weise, nach 
der Phosphoamiditmethode (Voet, Voet, 2. Auflage, Wiley Press New York, Sei- 
te 896-897) erfolgen. Die Anlagerung synthetischer Oligonukleotide und AuffQI- 
len von Lucken mithilfe des Klenow-Fragmentes der DNA-Polymerase und 
Ligationsreaktionen sowie allgemeine Klonierungsverfahren werden in 
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gationsreaktionen sowie allgemeine Klonierungsverfahren werden in Sambrook 
et aL (1989), Molecular cloning: A laboratory manual, Cold Spring Harbor Labo- 
ratory Press, beschrieben. 

Der in der Transformation (i) eingesetzte Vector enthalt vorzugsweise den gpd 
Promoter und/oder den trpC Terminator. Diese haben sich zur Transformation 
der Blakeslea besonders bewahrt 

Vorteilhafterweise weist der im Vector eingesetzte gpd Promotor die Sequenz 
SEQ ID NO: 1 auf . Vorteilhafterweise weist der im Vector eingesetzte trpC Ter- 
minator die Sequenz SEQ ID NO: 2 auf. 

Insbesondere werden dabei der gpd Promotor und der trpC Terminator aus 
Aspergillus nidulans eingesetzt. 

Insbesondere enthalt der in der Transformation (i) eingesetzte Vector ein Resi- 
stenzgen. Bevorzugterweise handelt es sich um ein Hygromycin-Resistenzgen 
(hph), insbesondere das aus E. coli. Dieses Resistenzgen hat sich bei dem 
Nachweis der Transformation und Selektion der Zellen als besonders geeignet 
herausgestellt. 

Als Promotor fur hph wird also bevorzugt p-gpdA, der Promotor der Glycerinal- 
dehyd-3-phosphatdehydrogenase aus Aspergillus nidulans genutzt. Als Termi- 
nator fur hph wird bevorzugt t-trpC, der Terminator des Gens trpC, codierend 
fQr Anthranilatsynthasekomponenten aus Aspergillus nidulans genutzt. 

Der Vector kann beispielsweise die SEQ ID NO: 3 aufweisen. 

Mit dem erfindungsgemalien Verfahren sind gentechnisch veranderte Organis- 
men Blakeslea, insbesondere der Art Blakeslea trispora bzw. aus ihnen gebilde- 
tes Mycel erhaltlich. 

Die genetisch veranderten Organismen konnen zur Produktion von Carotinoi- 
den, Xanthophyllen Oder deren Vorstufen verwendet werden. Auch k6nnen 
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neue, im Wildtyp naturiicherweise nicht vorkommende Carotinoide durch Ein- 
bringung der entsprechenden genetischen Information von den gezielt gene- 
tisch venSnderten Zellen bzw. dem durch sle gebildeten Mycel erzeugt und an- 
schlieftend isoliert werden. 

Bevorzugterwelse ist die Gewinnung von Carotinoiden-oder deren Vorstufen mit 
den gezielt genetisch veranderten Zellen bzw. das durch sie gebildete Mycel 
moglich. 

Die Erfindung wird nachfolgend an Hand von Beispielen nahier ausgefuhrt. 
Beispiele 

Molekulargenetische Arbeiten wurden, wenn nicht anders beschrieben, nach 
den Methoden in Current Protocols in Molecular Biology (Ausubel et al., 1999, 
John Wiley & Sons) durchgefuhrt. 

Stamme und Wachstumsbedingungen 

Der Blakeslea trispora Stamm ATCC 14272 (-) (ein Wildtyp) wurde erhalten von 
der American Type Culture Collection. Die Anzucht von B. trispora erfolgte in 
MEP-Medium (Malzextrakt-Pepton-Medium): 30 g/l Malzextrakt (Difco), 3 g/l 
Pepton (Soytone,. Difco), 20 g/l Agar, Einstellung pH 5,5, ad 1000 ml mit H 2 0 
bei28°C. 

Die Anzucht von Agrobacterium tumefaciens LBA4404 erfolgte nach Hoekema 
et al. (1983, Nature 303:179-180) bei 28 °C fur 24 h in Agrobacterien-Minimal 
Medium (AMM): 10 mM K 2 HP0 4 , 10 mM KH 2 P0 4 , 10 mM Glucose, MM-Salze 
(2,5 mM NaCI, 2 mM MgS0 4 , 700 uM CaCI 2 , 9 pM FeS0 4 , 4 mM (NH 4 ) 2 S0 4 ). 

Transformation von Agrobacterium tumefaciens 

Das Plasmid pBinAHyg wurde in den Agrobakterienstamm LBA 4404 (Hoekema 
et al., 1983, Nature 303:179-180) elektroporiert (Mozo and Hooykaas, 1991, 
Plant Mol. Biol. 16:917-918). Zur Selektion wurden bei der Agrobakterierian- 
zucht folgende Antibiotika verwendet: Rifampicin 50 mg/l (Selektion auf das A. 
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tumefaciens Ghromosom),. Streptomycin 30 mg/l (Selektion auf das Helferplas- 
mid) und Kanamycin 100 mg/l (Selektion auf den binareri Vektor). 

Transformation von Biakeslea trispora 

Zur Transformation wurden die Agrobakterien nach 24 h Anzucht in AMM auf 
eine OD 6 oo von 0,15 in Induktionsmedium (IM: MM-Salze, 40 mM MES (pH 5,6), 
5 mM Glucose, 2 mM Phosphat, 0,5% Glycerol, 200 pM Acetosyringone) ver- 
dunnt und emeut Qber Nacht in IM bis zu einer OD 6 oo von ca. 0,6 angezogen. 

Zur Co-lnkubation von Biakeslea und Agrobacterium wurden 100 pi Agrobakte- 
riensuspension mit 100 pi Biakeslea Sporensuspension (10 7 Sporen/ml in 0,9% 
NaCI) gemischt und steril auf einer Nylon Membran (Hybond N, Amersham) auf 
IM-Agarose Platten (IM + 18 g/l Agar) verteilt. Nach 3 Tagen Inkubation bei 26 
°C wurde die Membran auf eine MEP-Agarplatte (30 g/l Malzextrakt, 3 g/l Pep- 
ton, pH 5,5, 18 g/l Agar) uberfuhrt. Zur Selektion auf trarisformierte Blakeslea- 
zellen enthielt das Medium Hygromycin in einer Konzentration von 100 mg/l 
sowie zur Selektion gegen Agrobakterien 100 mg/l Cefotaxim. Die Inkubation 
erfolgte ftir ca. 7 Tage bei 26 °C. Anschlieliend erfolgte der Transfer von Mycel 
auf frische Selektionsplatten. Gebildete Sporen wurden mit 0,9% NaCI abge- 
spiilt und auf CM1 7-1 -Agar (3 g/l Glucose, 200 mg/l L-Asparagin, 50 mg/l 
MgSQ 4 x 7H 2 0, 150 mg/l KH 2 P0 4 , 25 pg/l ThiaminHCI, 100 mg/l Yeast Extract, 
100 mg/l Na-desoxychblat, pH 5,5,18 g/I Agar) ausplattiert. 

Mutagenese mit MNNG 

Zur Reduzierung der Anzahl von Kemen pro Spore wurde eine Behapdlung von 
Sporensuspensionen mit MNNG (N-Methyl-N-nitro-N-nitrdsoguanidin) durchge- 
fuhrt HierfQr wurde zunSchst eine Sporensuspension mit 1 x 10 7 Sporen/ml in 
Tris/HCI-Puffer, pH 7,0 hergestellt. Der Sporensuspension wurde MNNG in ei- 
ner Endkonzentration von 100 pg/ml zugegeben. Die Zeit der Inkubation in 
MNNG wurde so gewahlt, dass die Dberlebensrate der Sporen ca. 5% betrug. 
Nach Inkubation mit MNNG wurden die Sporen dreimal mit 1g/l Span 20 in 50 
mM PHosphatpuffer pH 7,0 gewaschen und plattiert. 



Selektion homonukieater Zellen 
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Die Selektion homonukleater Zellen von Blakeslea trispbra carB" erfolgte ana- 
log zum Versuchsprotokoll fur Phycomyces blakesleeanus (Roncero et al., 
1984, Mutation Research, .125:195-204), modifiziert durch Wachstum in Ge- 
genwart von 5-Carbon-5-Deazariboflavin (1 pg/ml) und Hygromycin 100 (pg/ml). 

Herstellung genetisch veranderter Blakeslea trispora durch Agrobacteri- 

um-vermittelte Transformation 

Herstellung des rekombinanten Plasmids pBinAHyg 

Aus dem Plasmid pANsCosI (Fig.1, Osiewacz, 1994, Curr. Genet. 26:87-90, 
SEQ ID NO: 4) wurde die gpdA-hph-trpC-Kassette ais Bglll/Hindlll Fragment 
isoliert und in das mit BamHI/Hindlll geoffnete binare Plasmid pBin19 (Bevan, 
1984, Nucleic Acids Res. 12:8711-8721) ligiert. Der so erhaltene Vektor wurde 
als pBinAHyg bezeichnet (Fig. 2, SEQ ID NO: 3) und enthielt das E. coli Hy- 
gromycin-Resistenzgen (hph) unter Kontrolle des gpd Promoters (SEQ ID NO: 
1) und des trpC Terminators (SEQ ID NO: 2) aus Aspergillus nidulans sowie 
die entsprechenden Bordersequenzen, die fur den DNA-Transfer von Agrobac- 
terium notwendig sind. 

Ubertragung von pBinAHyg in Agrobacterium tumefaciens 

Das Plasmid pBinAHyg wurde in den Agrobakterienstamm LBA 4404 (Hoekema 
et al., 1983, Nature 303:179-180) elektroporiert (Mozo and Hooykaas, 1991, 
Plant Mol. Biol. 16:917-918). Zur Selektion wurden bei der Agrobakterienan- 
zucht folgende Antibiotika yerwendet: Rifampicin 50 mg/l (Selektion auf das A. 
tumefaciens Chromosom), Streptomycin 30 mg/l (Selektion auf das Helferplas- 
mid) und Kanamycin 100 mg/l (Selektion auf den binaren Vektor). 

Ubertragung von pBinAHyg in Blakeslea trispora 

Zur Transformation wurden die Agrobakterien nach 24 h Anzucht in AMM auf 
eine OD 6 6o von 0,15 in Induktionsmedium (IM: MM-Salze, 40 mM MES (pH 5,6), 
5 mM Glucose, 2 mM Phosphat, 0,5% Glycerol, 200 uM Acetosyringone) ver- 
dOnnt und erneut Ober Nacht in IM bis zu einer OD660 von ca. 0,6 angezogen. 

Zur Co-lnkubation von Blakeslea trispora (B.t.) und Agrobacterium tumefaciens 
(AX.) wurden 100 pi Agrobakteriensuspension mit 100 pi Blakeslea Sporensus- 
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pension (10 7 Sporen/mf in 0,9% Nad) gemischt und steril auf einer Nylon 
Membran (Hybond N, Amersham) auf IM-Agarose Platten (IM + 18 g/l Agar) 
verteilt Nach 3 Tagen Inkubation bei 26 °C wurde die Membran auf eine MEP- 
Agarplatte (30 g/l Malzextrakt, 3 g/l Pepton, pH 5,5, 18 g/l Agar) uberfuhrt. 

5 

Zur Selektion auf transformierte Blakeslea-Zellen enthielt das Medium Hygro- 
mycin in einer Konzentration von 100 mg/l sowie zur Selektion gegen Agrobak- 
terien 100 mg/l Cefotaxim. Die Inkubation erfolgte fur ca. 7 Tage bei 26 °C. An- 
schlie&end erfolgte der Transfer von Mycel auf frische Selektionsplatten. Gebil- 
10 dete Sporen wurden mit 0,9% NaCI abgespGIt und auf CM1 7-1 -Agar (3 g/l Glu- 
cose, 200 mg/l L-Asparagin, 50 mg/l MgS0 4 x 7H 2 0, 150 mg/l KH2P04, 25 ug/l 
Thiamin-HCI, 100 mg/l Yeast Extract, 100 mg/l Na-desoxycholat, pH 5,5, 100 
mg/l Cefotaxim, 100 mg/l Hygromycin, 18 g/l Agar) ausplattiert. Die Obertragung 
von Sporen auf frische Selektionsplatten wurde. dreimal wiederholt. Auf diese 
15 Weise wurde die Transformante Blakeslea trispora GVO 3005 isoliert. 

Nachweis der genetischen Veranderung von Blakeslea trispora 

200 ml MEP-Medium (30 g/l Malzextrakt, 3 g/I Pepton, pH 5,5) wurden mit 10 5 
bis 10 7 Sporen der Transformante Blakeslea trispora GVO 3005 beimpft und 7 
20 Tage bei 26 °C mit 200 Upm auf einem RundschOttler inkubiert. Zum Nachweis 
der erfolgreichen Transformation wurde DNA aus dem Mycel isoliert (Peqlab 
Fungal DNA Mini Kit) und in einer PCR (Programm: 94 °C 1 min, dann 30 Zy- 
klen mit 1 min. 94°C, 1 min. 58 °C, 1 min. 72 °C) eingesetzt. . 

25 Zum Nachweis des Hygromycinresistenzgens (hph) wurden die Primer hph- 
forward (5-CGATGTAGGAGGGCGTGGATA, SEQ ID NO: 5) und hph-reverse 
(5'-GCTTCTGCGGGCGATTTGTGT, SEQ ID NO: 6) verwendet. Das erwartete 
Fragment von hph wies eine Lange von 800 bp auf. 

.30 Zur Amplifikation des Kanamycinresistenzgens nptlll und damit als Kontrolle auf 
Agrobakterien wurden . die Primer nptlll-forward (5- 
TG AG AATATCACCGGAATTG , SEQ ID NO: 7) und nptlll-reverse (5'- 
AGCTCGACATACTGTTCTTCC, SEQ ID NO: 8) verwendet. Das erwartete 
Fragment von nptlll wies eine Lange von 700 bp auf. 
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Zur . Ampiifikation eines Fragmentes des Glycerinaldehyd-3- 
phosphatdehydrogenasegens gpdl und damit als Kontrolle auf Blakeslea 
trispora wurden die Primer MAT292 (5 - GTGAATGGAAATCCCATCGCTGTC, 
5 SEQ ID NO: 9) und MAT293 (5-AGTGGGTACTCTAAAGGCCATACC, SEQ ID 
NO: 10) verwendet Das erwartete Fragment von gpdl wies eine Lange von 
500 bp auf. 

Das Ergebnis der PCR der Blakeslea trispora DNA ist in Fig. 3 anhand eines 
10 Standard-Gels gezeigt. Die Spuren des Gels wurden folgendermaBen belegt: 

1) 100 bp GroBenmarker (100 bp - 1 kb) 

2) B.t. GVO 3005 primer .nptlll-for / nptlll-rev 

3) B.t. GVO 3005 primer hph-for / hph-rev 

15 4) B.t. GVO 3005 primer MAT292 / MAT293 (gpd) 

5) At. mit Plasmid pBinAHyg primer nptlll-for / nptlll-rev 

6) At. mit Plasmid pBinAHyg primer hph-for/ hph-rev 

7) B.t. 14272 WT primer nptlll-for/ nptlll-rev 

8) B.t. 1 4272 WT primer hph-for / hph-rev 

20 9) B.t, 14272 WT primer MAT292 / MAT293 (gpd) 

In der DNA von Blakeslea trispora wurde das Hygromycinresistenzgens (hph) 
und als Positivkontrolle Glycerinaldehyd-3-phosphatdehydrogenasegen (gpdl) 
nachgewiesen. nptlll konnte demgegenQber nicht nachgewiesen werden. 

25 

Somit wurde die genetische VerSnderung von Blakeslea trispora durch Agro- 
bacterium-vermittelte Transformation nachgewiesen. 

Isolierung homokaryotischer GVO von Blakeslea trispora: 

30 Durch erfolgreichen Transfer des Vectors pBinAHyg in Blakeslea trispora ent- 
standen genetisch veranderte Organismen. In Blakeslea liegen in alien Stadien 
des vegetativen und des sexuellen Zellzyklus mehrkernige Zellen vor. Daher 
erfolgte die Insertion der Vector-DNA in der Regel nur in einem Kern. Ziel ist es 
aber, dass die Insertion der Vector-DNA in alien Kemen vorliegt. 
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Zur Herstellung solcher homokaryotischer Zellen wurden zunachst Sporensus- 
pensionen der rekombinanten Stamme mit MNNG behandelt. HierfQr wurde 
eine Sporensuspension mit 1 x 10 7 Sporen/ml in Tris/HCI-Puffer, pH 7,0 herge- 
5 stellt. Der Sporensuspension wurde MNNG in einer Endkonzentration von 100 
ug/ml zugegeben. Die Dauerder Inkubation mit MNNG wurde so gewahlt, dass 
die Clberlebensrate der Sporen -5% betrug. Nach Inkubation mit MNNG wurden 
die Sporen dreimal mit 1g/l Span 20 in 50 mM Phosphatpuffer pH 7,0 gewa- 
schen und plattiert. 

10 

Anschliefiend wurden die Sporen auf MEP-Agarplatten ausplattiert und neue 
^ Sporen erzeugt. 

Diese Sporen wurden analog zur Vorschrift von Roncero et al. auf Medium mit 
15 5-Carbon-5-deazariboflavin plattiert, das zusatzlich Hygromycin enthielt. 

Hierdurch wurden homokaryonte Zellen des Genotyps hyg R und dar" selektiert. 

Nach diesem Prinzip wurden homokaryonte Stamme von Blakeslea trispora mit 
20 dem Phanotyp hyg R und dar" erzeugt. 
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Patentanspruche 

1. Verfahren zur Herstellung eines gentechnisch veranderten Organismus der 
Gattung Blakeslea umfassend 

5 (i) Transformation mindestens einer der Zellen, 

(ii) ggf. Homokaryotisierung der aus (i) erhaltenen Zellen durch Eliminie- 
rung von Kemen in diesen Zellen, so dass mindestens eine Zelle mit 
nur einem Kern verbleibt, der die gewunschte genetische Veranderung 
aus (i) aufweist und zur Auspragung fuhrt, und 

io (iii) Selektion der gentechnisch veranderten Zelle oder Zellen. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass es sich urn 
Zellen von Pilzen der Art Blakeslea trispora handelt. 

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass in der 
Transformation (i) ein Vector oder freie Nukleinsauren verwendet werden. 

15 4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass der in der 
Transformation (i) eingesetzte Vector in das Genom mindestens einer der 
Zellen integriert wird. 

5. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass der in der 
Transformation (i) eingesetzte Vector derart gestaltet ist, dass die im Vector 

20 enthaltene genetische Information in der Zelle ausgeschaltet wird. 

6. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass der in der 
Transformation (i) eingesetzte Vector derart gestaltet ist, dass die im Vector 
enthaltene genetische Information in die Zelle eingefOhrt wird. 

7. Verfahren nach einem der vorhergehenden Ansprtiche 3 bis 6, dadurch 
25 gekennzeichnet, dass der in der Transformation (i) eingesetzte Vector ei- 

nen Promotor und/oder einen Terminator enthalt. 
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8. Verfahren nach einem der vorhergehenden Anspruche 3 bis 7, dadurch 
gekennzeichnet, dass in der Transformation (i) ein Vector enthaltend den 
gpd Promoter und/oder den trpC Terminator eingesetzt wird. 

9. Verfahren nach einem der vorhergehenden Anspriiche 3 bis 8, dadurch 
5 gekennzeichnet, dass in der Transformation (i) ein Vector enthaltend ein 

Resistenzgen eingesetzt wird. 

10. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass der in der 
Transformation (i) eingesetzte Vector ein Hygromycin-Resistenzgen (hph), 
insbesondere aus E. coii enthalt. 

to 11. Verfahren nach einem der vorhergehenden Anspriiche 7-10, dadurch ge- 
r kennzeichnet, dass der gpd Promotor die Sequenz SEQ ID NO: 1 aufweist. 

12. Verfahren nach einem der vorhergehenden Anspruche 7 - 10, dadurch ge- 
kennzeichnet, dass der trpC Terminator die Sequenz SEQ ID NO: 2 auf- 
weist. 

15 13. Verfahren nach einem der Anspruche 8 bis 12, dadurch gekennzeichnet, 
dass der gpd . Promotor und der trpC Terminator aus Aspergillus nidulans 
stammen. 

14. Verfahren nach einem Anspruche 3 bis 13, dadurch gekennzeichnet, dass 
k der Vector die SEQ ID NO: 3 umfasst. 

20 15. Verfahren nach einem der vorhergehenden AnsprOche, dadurch gekenn- 
zeichnet, dass die Transformation (i) mittels Agrobakterien, Konjugation, 
Chemikalien, Elektroporation, Beschuss mit DNA-beladenen Partikeln, Pro- 
toplasten oder Mikroinjektion durchgefQhrt wird. 

16. Verfahren nach. einem der vorhergehenden Anspriiche, dadurch gekenn- 
25 zeichnet, dass in der Homokaryontisierung (ii) ein mutagenes Agens einge- 
setzt wird. 

17. Verfahren nach Anspruch 16, dadurch gekennzeichnet, dass als mutage- 
nes Agens N-Methyl-N'-nitro-nitrosoguanidin (MNNG) eingesetzt wird. 
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18. Verfahren nach einem der vorhergehenden Anspruche, dadurch gekenn- 
zeichnet, dass in der Selektion (iii) 5-Carbon-5-deazariboflavin (darf) und 
Hygromycin (hyg) eingesetzt werden. 

19. Verfahren nach einem der Anspruche 3 bis 18, dadurch gekennzeichnet, 
dass der in der Transformation (i) eingesetzte Vector genetische Informatio- 
nen zur Herstellung von Carotinoiden oder deren Vorstufen enthalt. 

20. Verfahren nach einem der Anspruche 3 bis 19, dadurch gekennzeichnet, 
dass der in der Transformation (0 eingesetzte Vector genetische Informatio- 
nen zur Herstellung von Carotinen oder Xanthbphyllen enthalt. 

21. Verfahren nach einem der Anspruche 3 bis 20, dadurch gekennzeichnet, 
dass der in der Transformation (i) eingesetzte Vector genetische Infbrmatio- 
nen zur Herstellung von Astaxanthin, Zeaxanthin, Echinenon, p- 
Cryptoxanthin, Andonixanthin, Adonirubin, Canthaxanthin, 3- 
Hydroxyechinenon, 3-Hydroxyechinenon, Lycopin, p-Carotin, Lutein oder 
Phytoen enthalt. 

22. Genetisch veranderte mehrkemige Zellen der zur Gattung Blakeslea geh6- 
renden Pilze, insbesondere Blakeslea trispora erhaltlich nach einem der vor- 
hergehenden Anspruche. 

23. Verwendung der Zellen nach Anspruch 22 oder eines aus ihnen gebildeten 
Mycels zur Herstellung von Carotinoiden oder deren Vorstufen. 

24. Verwendung nach Anspruch 22 oder 23 zur Herstellung von Carotinen oder 
Xanthophyllen. 

25. Verwendung 22 bis 24 zur Herstellung von Astaxanthin, Zeaxanthin, Echi- 
nenon, p-Cryptoxanthin, Andonixanthin, Adonirubin, Canthaxanthin, 3- 
Hydroxyechinenon, 3-Hydroxyechinenon, Lycopin, p-Carotin, Lutein oder 
Phytoen. 

26. Promoter mit der Sequenz SEQ ID NO: 1 zur Verwendung in dem Verfah- 
ren nach einem der Anspruche 1 - 21 . 
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27. Terminator mit der Sequenz SEQ ID NO: 2 zur Verwendung in dem Verfah- 
ren nach einem der Anspriiche 1-21. 

28. Vector mit der SEQ ID NO: 3 zur Verwendung in dem Verfahren nach ei- 
nem der AnsprGche 1 - 21 . 
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Verfahren zur gentechnischen Veranderuna von Organjs men der Gattuno 
Blakeslea, entsprechende Oraanismen und der en Verwendunq 

Zusammenfassunq 

Verfahren zur Herstellung eines gentechnisch veranderten Organisrnus der 
Gattung Blakeslea umfassend 

(i) Transformation mindestens einer der Zellen, 

(ii) ggf. Homokaryontisierung der aus (i) erhaltenen Zellen durch Eliminie- 
rung von Kemen in diesen Zellen, so dass mindestens eine Zelle mit 
nur einem Kem verbleibt, der die gewunschte genetische Veranderung 
aus (i) aufweist und zur Auspragung fiihrt, und 

(Hi) Selektion der gentechnisch veranderten Zelle oder Zellen; 

entsprechende Organismen und deren Verwendung. 
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Fig. 1: Vektor pANsCosI 




Atoll (5012) 



Fig. 2: Vektor pBinAHyg 
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Fig. 3: Gels des Ergebnis einer PCR 
Spur. 
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SEQUENZPROTOKOIiL 

<110> BASF AG 

<120> Verfahren zur gezielten genetischen Veranderung von 

mehrkernigeri Zel-len des Pilzes der Gattung Blakeslea, 
entsprechende Zellen und deren Verwendung 

<130> BASF NAE 597/03 



<140> 
<141> 




)^BL60> 10 



<170> Patentln Ver. 2.1 



<2JL0> 1 
<211> 2160 
<212> DNA 

<213> Kunstliche Sequenz 
<220> ' 

<223> Beschreibung der kiinst lichen Sequenz : Promotor 



<400> 1 

ttcgacac tgaaatacgt cgagcctgct ccgcttggaa gcggcgagga gcctcgtcct . 60 
acaacta ccaacatgga gtacgataag ggccagttcc gccagctcat taagagccag 120 
tcatgggcg- ttggcatgat ggccgtcatg catctgtact tcaagtacac caacgctctt 180 
ctgatccagt cgatcatccg ctgaaggcgc tttcgaatct ggttaagatc cacgtcttcg 240 
ggaagccagc gactggtgac ctccagcgtc cctttaaggc tgccaacagc tttctcagcc 300 
agggccagcc caagaccgac aaggcctccc tccagaacgc cgagaagaac tggaggggtg 360 
gtgtcaagga ggagtaagct ccttattgaa gtcgga'ggac ggagcggtgt caagaggata 420 
ttcttcgact ctgtattata gataagatga tgaggaattg gaggtagcat agcttcattt 480 
ggatttgctt tccaggctga gactctagct tggagcatag agggtccttt ggctttcaat 540 
attctcaagt atctcgagtt tgaacttatt ccctgtgaac cttttattca ccaatgagca 600 
ttggaatgaa catgaatctg aggactgcaa tcgccatgag gttttcgaaa tacatccgga 660 
tgtcgaaggc ttggggcacc tgcgttggtt gaatttagaa cgtggcacta ttgatcatcc 720 
gatagctctg caaagggcgt tgcacaatgc aagtcaaacg ttgctagcag ttccaggtgg 780 
aatgttatga tgagcattgt attaaatcag gagatatagc aiigatctcta gttagctcac * 840 
cacaaaagtc agacggcgta accaaaagtc acacaacaca agctgtaagg atttcggcac 900 
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ggctacggaa gacggagaag ccaccttcag tggactcgag taccatttaa ttctatttgt 960 
gtttgatcga gacctaatac agcccctaca acgaccatca aagtcgtata gctaccagtg 1020 
aggaagtgga ctcaaatcga cttcagcaac .atctcctgga taaactttaa gcctaaacta 1080 
tacagaataa gataggtgga gagcttatac cgagctccca aafcctgtcca gatcatggtt 1140 
gaccggtgcc tggatcttcc tatagaatca tccttattcg ttgacctagc tgattctgga 1200 
gtgacccaga gggtcatgac ttgagcctaa aatccgccgc ctccaccatt tgtagaaaaa 1260 
tgtgacgaac tcgtgagctc tgtacagtga ccggtgactc tttctggcat gcggagagac 1320 
ggacggacgc agagagaagg gctgagtaat aagccactgg ccagacagct ctggcggctc 1380 
tgaggtgcag tggatgatta ttaatccggg accggccgcc cctccgcccc gaagtggaaa 1440 
ggctggtgtg cccctcgttg accaagaatc tattgcatca tcggagaata tggagcttca 1500 
tcgaatcacc ggcagtaagc gaaggagaat gtgaagccag gggtgtatag ccgtcggcga 1560 
aatagcatgc cattaaccta ggtacagaag tccaattgct tccgatctgg taaaagattc 1620 
acgagafcagt accttctccg aagtaggtag agcgagtacc cggcgcgtaa gctccctaat 1680 
"^^rgcccatcc ggcatctgta gggcgtccaa atatcgtgcc- tctcctgctt tgcccggtgt 1740 
■S/jftaaaccgg aaaggccgct caggagctgg ccagcggcgc agaccgggaa cacaagctgg 1800 
^^cagtcgaccc atccggtgct ctgcactcga cctgctgagg tccctcagtc cctggtaggc 1860 
agctttgccc cgtctgtccg cccggtgtgt cggcggggtt gacaaggtcg ttgcgtcagt 1920 
ccaacatttg ttgccatatt ttcctgctct ccccaccagc tgctcttttc ttttctcttt 19 80 
cttttcccat cttcagtata ttcatcttcc catccaagaa cctttatttc ccctaagtaa 2040 
gtactttgct acatccatac tccatccttc ccatccctta ttcctttgaa cctttcagtt 2100 
cgagctttcc cacttcatcg cagcttgact aacagctacc ccgcttgagc agacatcacc 2160 

<210> 2 
<211> 774 
<212> DNA 
^^«|213>" Kiinstliche Sequenz 

^^^220> 

<223> Beschreibung der kiinst lichen Sequenz : Terminator 
<400> 2 

cgatccactt aacgttactg aaatcatcaa acagcttgac gaatctggat ataagatcgt 60 
tggtgtcgat gtcagctccg gagttgagac aaatggtgtt caggatctcg ataagatacg 120 
ttcatttgtc caagcagcaa agagtgcctt ctagtgattt aatagctcca tgtcaacaag 180 
aataaaacgc gttttcgggt ttacctcttc cagatacagc tcatctgcaa tgcattaatg 240 
cattgactgc aacctagtaa cgccttncag gctccggcga agagaagaat agcttagcag 300 
agctattttc attttcggga gacgagatca agcagatcaa cggtcgtcaa gagacctacg 360 
agactgagga atccgctctt ggctccacgc gactatatat ttgtctctaa ttgtactttg 420 
acatgctcct cttctttact ctgatagctt gactatgaaa attccgtcac cagcncctgg 480 
gttcgcaaag ataattgcat gtttcttcct tgaactctca agcctacagg. acacacattc 540 
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atcgtaggta taaacctcga aatcanttcc tactaagatg gtatacaata gtaaccatgc 600 
atggttgcct agtgaatgct ccgtaacacc caatacgccg gccgaaactt ttttacaact 660 
ctcetatgag tcgtttaccc agaatgcaca ggtacacttg tttagaggta atccttcttt 720 
ctagctagaa gtcctcgtgt actgtgtaag cgcccactcc acatctccac tcga 774 



<210> 3 
<211> 15739 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der ktinstlichen Sequenz : Vector 



0> 3 

tctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 60 
cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 120 
cagttcatgg gcgttggcat gatggccgtc atgcatctgt acttcaagta caccaacgct 180 
cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 
tcgggaagcc agcgactggt gacctqcagc gtccctttaa ggctgccaac agctttctca 300 
gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 360 
gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 
atattcttcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 
tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 
aatattctca agtatctcga gtttgaactt attccctgtg aaccttttat tcaccaatga 600 
•gcattggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcc 660 
ggatgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 720 
gatagct ctgcaaaggg- cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 
gaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 840 
caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 
cacggctacg ' gaagacggag aagccacctt cagtggactc gagtaccatt taattctatt 960 
tgtgtttgat cgagacctaa tacagcccct acaacgacca tcaaagtcgt atagctacca i020 
gtgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa .1080 
ctatacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg 1140 
gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 

ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 1260 
aaatgtgacg aactcgtgag ctctgtacag tgaccggtga cfcctttctgg catgcggaga 1320 
•gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 1380 
ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 
aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 
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tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta tagccgtcgg 1560 
cgaaatagca tgccattaac ctaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 
ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 
aattggccca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 
tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 
tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 
ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 
agtccaacat ttgttgccat attttcctgc- tctccccacc agctgctctt ttcttttctc 1980 
tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttat ttcccctaag 2040 
taagtacttt gctacatcca tactccatcc ttcccatccc ttafctccttt gaacctttca 2100 
gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 
accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 
gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta 2280 

•pgggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 
jLgttfcatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 
gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 
gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 
atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 
ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtg^atcac 2640* 
tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 2700 
atgctfctggg. ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 27 60 
aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 2820 
ttcggggatt cccaatacga ggtcigccaac atcttcttct ggaggccgtg gttggcttgt 2880 
atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 
ctccgggcgt- atatgctccg cattggfcctt gaccaactct atcagagctt ggttgacggc 3000 
aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 
^"^ogactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 
WyqBaqaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 
tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 
tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg ' agacaaatgg 3300 
tgttcaggat ctcgafcaaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 3360 
atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 
cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 
gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3540 
tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 
atatttgtct ctaattgtac tttgacatgc tcctcttctt tactctgata gctfcgactat 3660 
gaaaatfcccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 
ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctacfcaa 3780 
gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840 
gccggccgaa acttttttac aactctccta tgagtcgttt acccagaatg cacaggtaca 3900 
cttgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtactgtg taagcgccca 3960 
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ctccacatct ccactcgacc tgcaggcatg caagcttggc gtaatcatgg tcatagctgt 4020 
ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa 4080 
agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac 4140 
tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 4200 
cggggagagg cggtttgcgt attgggccaa agacaaaagg gcgacattca accgattgag 4260 
ggagggaagg taaatattga cggaaattat tcattaaagg tgaattatca ccgtcaccga 4320 
cttgagccat ttgggaatta ga'gccagcaa aatcaccagt agcaccatta ccattagcaa 4380 
ggccggaaac gtcaccaatg aaaccatcga tagcagcacc gtaatcagta gcgacagaat 4440 
caagtttgcc tttagcgtca gactgtagcg cgttttcatc ggcattttcg gtcatagccc 4500 
ccttattagc gtttgccatc ttttcataat caaaatcacc ggaaccagag ccaccaccgg 4560 
aaccgcctcc ctcagagccg ccaccctcag aaccgccacc ctcagagcca ccaccctcag 4620 
agccgccacc agaaccacca ccagagccgc cgccagcatt gacaggaggc ccgatctagt 4680 
aacatagatg acaccgcgcg cgataattta tcctagtttg cgcgctatat tttgttttct 4740 
atcgcgtatt aaatgtataa ttgcgggact ctaatcataa aaacccatct cataaataac 4800 
atgcatt acatgttaat tattacatgc ttaacgtaat tcaacagaaa ttatatgata 4860 
catcgcaa gaccggcaac aggattcaat cttaagaaac tttattgcca aatgtttgaa 4920 
cgatcgggga tcatccgggt ctgtggcggg aactccacga aaatatccga acgcagcaag 4980 
atatcgcggt gcatctcggt cttgcctggg cagtcgccgc cgacgccgtt gatgtggacg 5040 
ccgggcccga tcatattgtc gctcaggatc gtggcgttgt gcttgtcggc cgttgctgtc 5100 
gtaatgatat cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc gaagaactcc 5160 
agcatgagat ccccgcgctg gaggatcatc eagccggcgt cccggaaaac gattccgaag 5220 
cccaaccttt catagaaggc ggcggtggaa tcgaaafccfcc gtgatggcag gttgggcgtc 5280 
gcttggtcgg tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca agaaggcgat 5340 
agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg aagcggtcag 5400 
cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg tcctgatagc 5460 
ggtccgccac acccagccgg ccacagtcga tgaatccaga aaagcggcca ttttccacca 5520 
tgatattcgg caagcaggca tcgccatggg tcacgacgag atcatcgccg tcgggcatgc 5580 
ccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct tcgtccagat 5640 
tcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg 5700 
cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc attgcatcag 5760 
; ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc tgccccggca 5820 
cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc acagctgcgc 5880 
aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc agttcattca 5940 
gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga 6000 
acacggcggc atcagagcag ccgatbgtct gttgtgccca gtcatagccg aatagcctct 6060 
ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg cgaaacgatc 6120 
cagatccggt gcagattatt tggattgaga gtgaatatga gactctaatt ggataccgag 6180 
gggaatttat ggaacgtcag tggagcattt ttgacaagaa atatttgcta gctgatagtg 6240 
accttaggcg acttttgaac gcgcaataat ggtttctgac gtatgtgctt agctcattaa 6300 
actccagaaa cccgcggctg agtggctcct tcaacgttgc ggttctgtca gttccaaacg 6360 
taaaacggct tgtcccgcgt catcggcggg . ggtcataacg tgactccctt aattctccgc 6420 
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tcatgatcag attgtcgttt cccgccttca gtttaaacta tcagtgtttg acaggatata 6480 
ttggcgggta aacctaagag aaaagagcgt ttattagaat aatcggatat ttaaaagggc 6540 
gtgaaaaggt ttatccgttc gtccatttgt atgtgcatgc caaccacagg gttccccaga 6600 
tctggcgccg gccagcgaga cgagcaagat tggccgccgc ccgaaacgat ccgacagcgc 6660 
gcccagcaca ggtgcgcagg caaattgcac caacgcatac agcgccagca gaatgccata 6720 
gtgggcggtg acgtcgttcg agtgaaccag atcgcgcagg aggcccggca gcaccggcat 6780 
aatcaggccg atgccgacag cgtcgagcgc gacagtgctc agaattacga tcaggggtat 6840 
gttgggtttc acgtctggcc tccggaccag cctccgctgg tccgattgaa cgcgcggatt 6900 
ctttatcact gataagttgg tggacatatt atgtttatca gtgataaagt gtcaagcatg 6960 
acaaagttgc agccgaatac agtgatccgt gccgccctgg acctgttgaa cgaggtcggc 7020 
gtagacggtc tgacgacacg caaactggcg gaacggttgg gggttcagca gccggcgctt 7080 
tactggcact tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc catgctggcg 7140 
gagaatcata cgcattcggt gccgagagcc gacgacgact ggcgctcatt tctgatcggg 7200 
gcccgca gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg catccatgcc 7260 
fcacgcgac cgggcgcacc gcagatggaa acggccgacg cgcagcttcg cttcctctgc 7320 
gaggcgggtt tttcggccgg ggacgccgtc aatgcgctga tgacaatcag ctacttcact 7380 
gttggggccg tgcttgagga gcaggccggc gacagcgatg ccggcgagcg cggcggcacc 7440 
gttgaacagg ctccgctctc gccgctgttg cgggccgcga tagacgcctt cgacgaagcc 7500. 
ggtccggacg cagcgttcga gcagggactc gcggtgattg tcgatggatt ggcgaaaagg 7560 
aggctcgttg tcaggaacgt fcgaaggaccg agaaagggtg acgattgatc aggaccgctg 7620 
ccggagcgca acccactcac tacagcagag ccatgtagac aacatcccct ccccctttcc 7680 
accgcgtcag acgcccgtag cagcccgcta cgggcttttt catgccctgc cctagcgtcc 7740 
aagcctcacg gccgcgctcg gcctctctgg cggccttctg gcgctcttcc gcttcctcgc 7800 
tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 7860. 
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 7920 
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 7980 
ccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag .8040 
ctataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 8100 
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgcttttcc 8160 
gctgcataac cctgcttcgg ggtcattata gcgatttttt cggtatatcc atcctttttc 8220 
gcacgatata caggattttg ccaaagggtt cgtgtagact ttccttggtg tatccaacgg 8280 
cgtcagccgg gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc .cttcttcact 8340 
gtcccttatt cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg ctggccggct 8400 
accgccggcg taacagatga gggcaagcgg atggctgatg aaaccaagcc aaccaggaag 8460 
ggcagcccac ctafccaaggt gtactgcctt ccagacgaac gaagagcgat tgaggaaaag 8520 
gcggcggcgg ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca gggctacaaa 8580 
atcacgggcg tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa tggcgacctg 8640 
ggccgcctgg gcggcctgct gaaactctgg ctcaccgacg acccgcgcac ggcgcggttc 8700 
ggtgatgcca cgatcctcgc cctgctggcg aagatcgaag agaagcagga cgagcttggc 8760 
aaggtcatga tgggcgtggt ccgcccgagg gcagagccat gactttttta gccgctaaaa 8820 
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. cggccggggg gtgcgcgtga ttgccaagca cgtccccatg cgctccatca agaagagcga 8880 

cttcgcggag ctggtgaagt acatcaccga cgagcaaggc aagaccgagc gcctttgcga 8940 
cgctcaccgg gctggttgcc ctcgccgctg ggctggcggc cgtctatggc cctgcaaacg 9000 
cgccagaaac gccgtcgaag ccgtgtgcga gacaccgcgg ccgccggcgt tgtggatacc 9060 
tcgcggaaaa cttggccctc actgacagat gaggggcgga cgttgacact tgaggggccg 9120 
actcacccgg cgcggcgttg acagatgagg ggcaggctcg atttcggccg gcgacgtgga 9180 
gctggccagc ctcgcaaatc ggcgaaaacg cctgatttta cgcgagtttc ccacagatga 9240 
tgtggacaag cctggggata agtgccctgc ggtattgaca cttgaggggc gcgactactg 9300 
acagatgagg ggcgcgatcc ttgacacttgr aggggcagag tgctgacaga tgaggggcgc 9360 
acctattgac atttgagggg ctgtccacag gcagaaaatc cagcatttgc aagggtttcc 9420 
gcccgttttt cggccaccgc taacctgtct tttaacctgc ttttaaacca atatttataa 9480 
accttgtttt taaccagggc tgcgccctgt gcgcgtgacc gcgcacgccg aaggggggtg 9540 

Igccccccttc tcgaaccctc ccggcccgct aacgcgggcc tcccatcccc ccaggggctg 9600 
cccctcgg ccgcgaacgg cctcacccca aaaatggcag cgctggcagt ccttgccatt 9660 
bcgggatcg gggcagtaac gggatgggcg atcagcccga gcgcgacgcc cggaagcatt 9720 
gacgtgccgc aggtgctggc atcgacattc agcgaccagg tgccgggcag tgagggcggc 9780 
ggcctgggtg gcggcctgcc cttcacttcg gccgtcgggg cattcacgga cttcatggcg 9840 
gggccggcaa tttttacctt gggcattctt ggcatagtgg tcgcgggtgc cgtgctcgtg 9900 
ttcgggggtg cgataaaccc agcgaaccat ttgaggtgat aggtaagatt ataccgaggt 99-50 
atgaaaacga gaattggacc tttacagaat tactctatga agcgccatat ttaaaaagct 1002 0 
accaagacga agaggatgaa gaggatgagg aggcagattg ccttgaatat attgacaata 10080 
ctgataagat aatatatctt ttatatagaa gatatcgccg tatgtaagga tttcaggggg 10140 
caaggcatag gcagcgcgct tatcaatata tctatagaat gggcaaagca taaaaacttg * 10200 
catggactaa tgcttgaaac ccaggacaat aaccttatag ct.tgtaaatt ctatcataat 10260 
tgggtaatga ctccaactta ttgatagtgt tttatgttca gataatgccc gatgactttg 10320 

I^catgcagct ccaccgattt tgagaacgac agcgacttcc gtcccagccg tgccaggtgc 103 8 0 
|cctcagat tcaggttatg ccgctcaatt . cgctgcgtat atcgcttgct gattacgtgc 10440 
^ctttccct tcaggcggga ttcatacagc ggccagccat ccgtcatcca tatcaccacg 10500 
tcaaagggtg acagcaggct cataagacgc cccagcgtcg ccatagfcgcg ttcaccgaat 10560 
acgtgcgcaa caaccgtctt ccggagactg tcatacgcgt aaaacagcca gcgctggcgc 10620 
gatttagccc cgacatagcc ccactgttcg tccatttccg cgcagacgat gacgtcactg 10680 
cccggctgta tgcgcgaggt taccgactgc ggcctgagtt ttttaagtga cgtaaaatcg 10740 
tgttgaggcc aacgcccata atgcgggctg ttgcccggca tccaacgcca ttcatggcca 10800 
tatcaatgat tttctggtgc gtaccgggtt gagaagcggt gtaagtgaac tgcagttgcc 10860 
atgttttacg gcagtgagag cagagatagc gctgatgtcc ggcggtgctt ttgccgttac 10920 
gcaccacccc gtcagtagct gaacaggagg gacagctgat agacacagaa gccactggag 10980 
cacctcaaaa acaccatcat acactaa'atc agtaagttgg cagcatcacc cataattgtg 11040 
gtttcaaaat cggctccgtc gatactatgt tatacgccaa ctttgaaaac aactttgaaa 11100 
aagctgtttt ctggtattta aggttttaga atgcaaggaa cagtgaattg gagttcgtct 11160 
tgttataatt agcttcttgg ggtatcttta aatactgtag aaaagaggaa ggaaataata 11220 
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aat'ggctaaa atgagaatat caccggaatt gaaaaaactg atcgaaaaat accgctgcgt 11280 
aaaagatacg gaaggaatgt ctcctgctaa ggtatataag ctggtgggag aaaatgaaaa 11340 
cctatattta aaaatgacgg acagccggta taaagggacc acctatgatg tggaacggga "1140 0 
aaaggacatg atgctatggc tggaaggaaa gctgcctgtt ccaaaggtcc tgcactttga 11460 
acggcatgat ggctggagca atctgctcat gagtgaggcc gatggcgtcc tttgctcgga 1152 0 
agagtatgaa gatgaacaaa gccctgaaaa gattatcgag ctgtatgcgg agtgcatcag 11580 
gctctttcac tccatcgaca tatc'ggattg tccctatacg aatagcttag acagccgctt 11640 
agccgaattg gat tact tac tgaataacga tctggccgat gtggattgcg aaaactggga 11700 
agaagacact ccatttaaag atccgcgcga gctgtatgat tttttaaaga cggaaaagcc 11760 
cgaagaggaa cttgtctttt ccca'cggcga cctgggagac agcaacatct ttgtgaaaga 1182 0 
tggcaaagta agtggcttta ttgatcttgg gagaagcggc agggcggaca agtggtatga 11880 
cattgccttc tgcgtccggt cgatcaggga ggatatcggg gaagaacagt atgtcgagct 11940 
attttttgac ttactgggga tcaagcctga ttgggagaaa ataaaatatt atattttacf 12000 

•tgaattg ttttagtacc tagatgtggc gcaacgatgc cggcgacaag caggagcgca 12060 
acttctt ccgcatcaag tgttttggct ctcaggccga ggcccacggc aagtatttgg 12120 
gcaaggggtc gctggtattc gtgcagggca agattcggaa taccaagtac gagaaggacg 12180 
gccagacggt ctacgggacc gacttcattg bcgataaggt ggattatctg gacaccaagg 12240 
caccaggcgg gtcaaatcag gaataagggc acattgcccc ggcgtgagtc ggggcaatcc 1230 0 
cgcaaggagg gtgaatgaat cggacgtttg accggaaggc atacaggcaa gaactgatcg 12360 
acgcggggtt ttccgccgag gatgccgaaa ccatcgcaag ccgcaccgtc atgcgtgcgc 1242 0 
cccgcgaaac cttccagtcc gtcggctcga tggtccagca agctacggcc aagatcgagc 1248 0 
gcgacagcgt gcaactggct ccccctgccc tgcccgcgcc atcggccgcc gtggagcgtt ,12540 
. cgcgtcgtct cgaacaggag gcggcaggtt tggcgaag.tc gatgaccatc gacacgcgag 12600 
gaactatgac gaccaagaag cgaaaaaccg ccggcgagga cctggcaaaa caggtcagcg 12660 
aggccaagca ggccgcgttg ctgaaacaca cgaagcagca gatcaaggaa atgcagcttt 1272 0 
ccttgttcga tattgcgccg t'ggccggaca cgatgcgagc gatgccaaac gacacggccc 1278 0 

•tctgccct gttcaccacg cgcaacaaga aaatcccgcg cgaggcgctg caaaacaagg 12840 
attttcca cgtcaacaag gacgtgaaga tcacctacac cggcgtcgag ctgcgggccg- 12900 
acgatgacga actggtgtgg cagcaggtgt tggagtacgc gaagcgcacc cctatcggcg 12960 
agccgatcac cttcacgttc tacgagcttt gccaggacct gggctggtcg atcaatggcc "13020 
ggtattacac gaaggccgag gaatgcc'tgt -cgcgcctaca ggcgacggcg atgggcttca 13080 
cgtccgaccg cgttgggcac ctggaatcgg tgtcgctgct gcaccgcttc cgcgtcctgg 13140 
accgtggcaa gaaaacgtcc cgttgccagg tcctgatcga cgaggaaatc gtcgtgctgt 13200 
ttgctggcga ccactacacg, aaattcatat gggagaagta ccgcaagctg tcgccgacgg 13260 
cccgacggat gttcgactat ttcagctcgc accgggagcc gtacccgctc aagctggaaa 1332 0 
ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc gagcaggtcg 13380 
gcgaagcctg cgaagagttg cgaggcagcg gcctggt'gga acacgcctgg gtcaatgatg 13440 
acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg ggttcagcag 13500 
ccagcgcttt actggcattt caggaacaag cgggcactgc tcgacgcact tgcttcgctc 13560 
agtatcgctc gggacgcacg gcgcgctcta cgaactgccg ataaacagag gattaaaatt 1362 0 
gacaattgtg attaaggctc agattcgacg gcttggagcg gccgacgtgc aggatttccg 13680 
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cgagatccga ttgfccggccc tgaagaaagc tccagagatg ttcgggtccg tttacgagca 13740 
cgaggagaaa aagcccatgg aggcgttcgc tgaacggttg cgagatgccg tggcattcgg 13800 
cgcctacatc gacggcgaga tcattgggct gtcggtcttc aaacaggagg acggccccaa 13860 
ggacgctcac aaggcgcatc tgtccggcgt tttcgtggag cccgaacagc gaggccgagg 1392 0 
ggtcgccggt atgctgctgc gggcgttgcc ggcgggttta ttgctcgtga tgatcgtccg 13980 
acagattcca acgggaatct ggtggatgcg catcttcatc ctcggcgcac ttaatatttc 14040 
gctattctgg agcttgttgt ttatttcggt ctaccgcctg ccgggcgggg tcgcggcgac 14100 
ggtaggcgct gtgcagccgc tgatggtcgt gttcatctct gccgctctgc taggtagccc 14160 
gatacgattg atggcggtcc tgggggctat ttgcggaact gcgggcgtgg cgctgttggt 14220 
gttgacacca aacgcagcgc tagatcctgt cggcgtcgca gcgggcctgg cgggggcggt 14280 
ttccatggcg ttcggaaccg tgctgacccg caagfcggcaa cctcccgtgc ctctgctcac 14340 
ctttaccgcc tggcaactgg cggccggagg acttctgctc gttccagtag ctttagtgtt 14400 
tgatccgcca atcccgatgc ctacaggaac caatgttctc ggcctggcgt ggctcggcct 14460 
cggagcg ggtttaacct acttcctttg gttccggggg atctcgcgac tcgaacctac 1452 0 
tgtttcc tfcactgggct ttctcagccc cagatctggg gtcgatcagc cggggatgca 14580 
tcaggccgac agtcggaact tcgggtcccc gacctgtacc attcggtgag caatggatag 14640 
gggagttgat atcgtcaacg ttcacttcta aagaaatagc gccactcagc ttcctcagcg 14700 
gctttatcca gcgatttcct attatgtcgg catagttctc aagatcgaca gcctgtcacg 14760 
gttaagcgag aaatgaataa gaaggctgat aattcggatc tctgcgaggg agatgatatt 1482 0 
tgatcacagg cagcaacgct ctgtcatcgt tacaatcaac atgctaccct ccgcgagatc 14880 
atccgtgttt caaacccggc agcttagttg ccgttcttcc gaatagcatc ggtaacatga 14940 
gcaaagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggact gatgggctgc 15000 
ctgtatcgag tggtgatttt .gtgccgagct gccggtcggg gagctgttgg ctggctggtg 150 60 
gcaggatata ttgtggtgta aacaaattga cgcttagaca acttaataac acattgcgga 15120 
cgtttttaat gtactggggt ggtttttctt ttcaccagtg agacgggcaa cagctgattg 15180 
cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt ttgccccagc 15240 
[gcgaaaat cctgtttgat ggtggttccg aaatcggcaa aatcccttat aaatcaaaag 15300' 
ftagcccga gatagggttg agtgfctgttc cagtttggaa caagagtcca ctattaaaga 15360 
acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 15420 
aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc 15480 
ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 15540 
aagggaagaa .agcgaaagga "gcgggcgcca ttcaggctgc gcaactgttg ggaagggcga 15600 
tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga 15660 
ttaagttggg taacgccagg gttttcccag tcacgacgtt gfcaaaacgac ggccagtgaa 15720 
ttcgagctcg gtacccggg 15739 
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<223> Beschreibung der kunst lichen Sequenz: Vector 
<400> 4 

agcttgcatg cctgcaggtc gagtggagat gtggagtggg cgcttacaca gtacacgagg 60 
acttctagct agaaagaagg attacctcta aacaagtgta cctgtgcatt ctgggtaaac 120 
gactcatagg agagttgtaa aaaagtttcg gccggcgtat tgggtgttac ggagcattca 180 
ctaggcaacc atgcatggtt actattgtat accatcttag taggaantga tttcgaggtt 240 
tatacctacg atgaatgtgt gtcctgtagg cttgagagtt caaggaagaa acatgcaatt 300 
atctttgcga acccaggngc tggtgacgga attttcatag tcaagctatc agagtaaaga 360 
agaggagcat gtcaaagtac aattagagac aaatatatag tcgcgtggag ccaagagcgg 420 
attcctcagt ctcgtaggtc tcttgacgac cgttgatctg cttgatctcg tctcccgaaa 480 

•aaaatag ctctgctaag otattcttct cttcgccgga gcctgnaagg cgttactagg 540 
cagtcaa tgcattaatg cattgcagat gagctgtatc tggaagaggt aaacccgaaa 600 
acgcgtttta ttcttgttga catggagcta ttaaatcact agaaggcact ctttgctgct 660 
tggacaaatg aacgtatctt atcgagatcc tgaacaccat ttgtctcaac tccggagctg 720 
acatcgacac caacgatctt atatccagat tcgtcaagct gtttgatgat ttcagtaacg 780 
ttaagtggat cgatcccgcg gtcggcatct actctattcc tttgccctcg gacgagtgct 840 
ggggcgtcgg tttccactat cggcgagtac ttctacacag ccatcggtcc agacggccgc 900 
gcttctgcgg gcgatttgtg tacgcccgac agtcccggct ccggatcgga cgattgcgtc 960 
• gcatcgaccc tgcgcccaag ctgcatcatc gaaattgccg tcaaccaagc tctgatagag 1020 
ttggtcaaga ccaatgcgga gcatatacgc ccggagccgc ggcgatcctg caagctccgg 1080 
atgcctccgc tcgaagtagc gcgtctgctg ctccatacaa gccaaccacg gcc'tccagaa 1140 
gaagatgfctg gcgacctcgt attgggaatc cccgaacatc gcctcgctcc agtcaatgac 1200 
cgctgttatg cggccattgt ccgtcaggac attgttggag ccgaaatccg cgtgcacgag 1260 
^^^^gccggact tcggggcagt cctcggccca aagcatcagc tcatcgagag cctgcgcgac 1320 
^^iS|acgcactg acggtgtcgt ccatcacagt ttgccagtga tacacatggg gatcagcaat 1380 
cgcgcatatg aaatcacgcc atgtagtgta ttgaccgatt ccttgcggtc cgaatgggcc 1440 
gaacccgctc gtctggctaa gatcggccgc agcgatcgca tccatggcct ccgcgaccgg 1500 
ctgcagaaca gcgggcagtt cggtttcagg caggtcttgc aacgtgacac cctgtgcacg 1560 
gcgggagatg caataggfcca ggctctcgct gaattcccca atgtcaagca cttccggaat 1620 
cgggagcgcg gccgatgcaa agtgccgata aacataacga tctttgtaga aaccatcggc 1680 
gcagctattt acccgcagga catatccacg ccctcctaca tcgaagctga aagcacgaga 1740 
ttcttcgccc tccgagagct gcatcaggtc ggagacgctg tcgaactttt cgatcagaaa 180Q 
cttctcgaca gacgtcgcgg tgagttcagg catggtgatg tctgctcaag cggggtagct 1860 
gttagtcaag ctgcgatgaa gtgggaaagc tcgaactgaa aggttcaaag gaataaggga 1920 
tgggaaggat ggagtatgga tgtagcaaag tacttactta ggggaaataa aggttcttgg 1980 
atgggaagat gaatatactg aagatgggaa aagaaagaga aaagaaaaga gcagctggtg 2040 
gggagagcag gaaaatatgg caacaaatgt tggactgacg caacgacctt gtcaaccccg 2100 
ccgacacacc gggcggacag acggggcaaa gctgcctacc agggactgag ggacctcagc 2160 
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aggtcgagtg cagagcaccg gatgggtcga cfcgccagctt gtgttcccgg tctgcgccgc 2220 
tggccagctc ctgagcggcc tttccggttt catacaccgg gcaaagcagg agaggcacga 2280 
tatttggacg ccctacagat gccggatggg ccaattaggg agcttacgcg ccgggtactc 2340 
- gctctaccta cttcggagaa ggtactatct cgtgaatctt ttaccagatc ggaagcaatt 2400 
ggacttctgt acctaggtta atggcatgct atttcgccga cggctataca cccctggctt 2460 
cacattctcc ttcgcttact gccggtgatt cgafcgaagct ccatattctc cgatgatgca 2520 
atagattctt ggtcaacgag gggcacacca gcctttccac ttcggggcgg aggggcggcc 2580 
ggtcccggat taataatcat ccactgcacc tcagagccgc cagagctgtc tggccagtgg 2640 
cttattactc agcccttctc tctgcgtccg tccgtctctc cgcatgccag aaagagtcac 2700 
cggtcactgt acagagctca cgagttcgtc acatttttct acaaatggtg gaggcggcgg 2760 
attttaggct caagtcatga ccctctgggt cactccagaa tcagctaggt caacgaataa 2820 
ggatgattct ataggaagat ccaggcaccg gtcaaccatg atctggacag atttgggagc 2880 
tcggtataag ctctccacct atcttattct gtatagttta ggcttaaagt ttatccagga 2940 

•tgttgctg aagtcgattt gagtccactt cctcactggt agctatacga ctttgatggt 3000 
ttgtaggg gctgtattag gtctcgatca aacacaaata gaattaaatg gtactcgagt 3060 
. ccactgaagg tggcttctcc gtcttccgta gccgtgccga aatccttaca gcttgtgttg 3120 
tgtgactttt ggttacgccg tctgactttt gtggtgagct aactagagat catgctatat 3180 
ctcctgattt aatacaatgc tcatcataac attccacctg gaactgctag caacgtttga 3240 
cttgcattgt gcaacgccct ttgcagagct atcggatgat caatagtgcc' acgttctaaa 3300 
ttcaaccaac gcaggtgccc caagccttcg acatccggat gtatttcgaa aacctcatgg 3360 
cgattgcagt cctcagattc atgttcattc caatgctcat tggtgaataa aaggttcaca 3420 
gggaataagt tcaaactcga gatacttgag aatattgaaa gccaaaggac cctctatgct 3480 
ccaagctaga gtctcagcct ggaaagcaaa tccaaatgaa gctatgctac ctccaattcc 3540 
tcatcatcfct atctataata cagagtcgaa gaatatcctc ttgacaccgc tccgtcc'tcc 3600 
gacttcaata aggagcttac tcctccttga caccacccct ccagttcttc tcggcgttct 3660 
ggagggaggc cttgtcggtc ttgggctggc cctggctgag aaagctgttg gcagcctfcaa 3720 

•ggacgctg gaggt caeca gtcgctggct tcccgaagac gtggatctta accagattcg 3780 
agegcett cageggatga tcgactggat cagaagagcg ttggtgtact tgaagtacag 3840 
atgcatgacg gccatcatgc caacgcccat gaactggctc ttaatgagct ggcggaactg 3900 
gcccttatcg tactccatgt tggtagttgt gacaggacga ggctcctcgc cgcttccaag 3960 
eggagcagge tegaegtatt tcagtgtcga aagatctgat caagagacag gatgaggatc 4020 
gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt gggtggagag 4080 
getattegge tatgactggg cacaacagac aatcggctgc tetgatgecg ccgtgttccg 4140 
gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg gtgccctgaa 4200 
tgaactgcag gacgaggcag cgcggctatc gtggctggcc aegaegggeg ttccttgcgc 4260 
agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg gcgaagtgcc 4320 
ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca tcatggctga 4380 
tgeaatgegg eggctgeata cgcttgatcc ggctacctgc ccattcgacc accaagegaa 4440 
acatcgcatc gagegagcac gtacteggat ggaagccggt cttgtcgatc aggatgatct 4500 
ggacgaagag catcaggggc tcgcgccagc cgaactgttc gccaggctca aggegegcat 4560 
gcccgacggc gaggatctcg tcgtgaccca tggegatgee tgettgeega atatcatggt- 4620 
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ggaaaatggc cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg cggaccgcta 4680 
tcaggacata gcgttggcta cccgtgatat tgctgaagag cttggcggcg aatgggctga 4740 
ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg ccttctatcg 4800 
ccttcttgac gagttcttct gagcgggact ctggggttcg aaatgaccga ccaagcgacg 4860 
cccaacctgc catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc 4920 
ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag 4980 
ttcttcgccc accccgggct cgatcccctc gcgagttggt tcagctgctg cctgaggctg 5040 
gacgacctcg cggagttcta ccggcagtgc aaatccgtcg gcatccagga aaccagcagc 5100 
ggctatccgc gcatccatgc ccccgaactg caggagtggg gaggcacgat ggccgcttfcg 5160 
gtccggatct ttgtgaagga accttacttc tgtggtgtga cataattgga caaactacct 5220 
acagagattt aaagctctaa ggtaaatata aaatttttaa gtgtataatg tgttaaacta 5280 
ctgattctaa •. tfcgtttgtgt attttagatt ccaacctatg gaactgatga atgggagcag 5340 
tggtggaatg cctttaatga ggaaaacctg ttttgctcag aagaaatgcc atctagtgat 5400 
atgaggcta ctgctgactc tcaacattct actcctccaa aaaagaagag aaaggtagaa 5460 
cccaagg actttccttc agaattgcta agttttttga gtcatgctgt gtttagtaat 5520 
Ejaactcttg cttgctttgc tatttacacc acaaaggaaa aagctgcact gctatacaag 5580 
aaaattatgg aaaaatattc tgtaaccttt ataagtaggc ataacagtta taatcataac 5640 
atactgtttt ttcttactcc acacaggcat agagtgtctg ctatfcaataa ctatgctcaa 5700 
aaattgtgta cctrttagctt tttaatttgt aaaggggtta ataaggaata ttfcgatgtat 5760 
agtgccttga ctagagatca taatcagcca taccacattt gtagaggttt tacfctgcttt 5820 
aaaaaacctc ccacacctcc ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt 5880 
taacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 5940 
aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc 6000 
ttatcatgtc tggatctgac gggtgcgcat gatcgtgctc ctgtcgttga ggacccggct 6060 
aggctggcgg ggttgcctta ctggttagca gaatgaatca ccgatacgcg agcgaacgtg 6120 
aagcgactgc tgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg tcttcggttt 6180 
cgtgtttcg taaagtctgg aaacgcggaa gtcagcgctc ttccgcttcc tcgctcactg 6240 
tcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 6300 
"acggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc 6360. 
aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 6420 
gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 6480 
gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 6540 
tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 6600 
ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 6660 
ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 6720 
tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 6780 
tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 6840 
ctacactaga aggacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 6900 
aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 6960 
ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 7020 
tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 7080 
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atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 7140 
aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 7200 
ctcagcgatc- tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 7260 
tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 7320 
ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 7380 
tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt. 7440 
aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctgcag gcatcgtggt 7500 
gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 7560 . 
tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 7620 
cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc .ataattctct 7680 
tactgtcatg ccatccgtaa gafcgcttttc tgtgactggt gagtactcaa ccaagtcatt 7740 
ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaacac gggataatac 7800 
cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 7 860 
fc tctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 7920 
atcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 7980 
aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 8040 
ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 8100 
atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 8160 
tgacgtctaa-gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag 8220 
gccctttcgt cttcaagaat tcgcggccgc aattaaccct cactaaagga tccctatagt 8280 
gagtcgtatt atgcggccgc gaattctcat gtttgaccgc ttatcatcga taagctctgc 8340 
tttttgttga cttccattgt tcattccacg gacaaaaaca gagaaaggaa acgacagagg 8400 
ccaaaaagct cgctttcagc acctgtcgtt tcctttcttt tcagagggta ttttaaataa 8460 
aaacattaag ttatgacgaa gaagaacgga aacgccttaa accggaaaat tttcataaat 8520 
agcgaaaacc cgcgaggtcg ccgccccgta acaaggcgga ' tcgccggaaa ggacccgcaa 8580 
atgataataa ttatcaattg catactatcg acggcactgc tgccagataa caccaccggg 8640 - 
aacattcc atcatgatgg ccgtgcggac ataggaagcc agttcatcca tcgctttctt 8700 
tgctgcc atttgctttg tgacatccag cgccgcacat tcagcagcgt ttttcagcgc 8760 
gttttcgatc aacgtttcaa tgttggtatc aacaccaggt ttaactttga act t atcggc . 8820 
actgacggtt accttgttct gcgctggctc atcacgcagg ataccaaggc tgatgttgta 8880 
gatattggtc accggctgag ggttttcgat tgccgctgcg tggatagcac catttgcgat 8940 
caggcngtcc ttgatgaatg acactccatt gcgaataagt tcgaaggaga cggtgtcacg 9000 
aatgcgctgg tccagctcgg tcgattgcct tttgtgcagc agaggtatca ate teaaege 9060 
caaggctcat egaagegcaa tattgetget caccaaaacg egtattgace aggtgttcaa 9120 
eggcaaattt ctgcccttct gatgtcagaa aggcaaagtg attttctttc tggtattcag 9180 
ttgctgtgtg tcggtttcag caaaaccaag ctcgcgcaat tcggctgtgc agatttagaa 9240 
ggcagatcac cagacagcaa cggccaacgg aaaacagege atacagaaca tccgtcgccg 9300 
cgccgacaac gtgataattt ttatgaccca tgatttattt ccttttagac gtgagcctgt 9360 
cgcacagcaa agccgccgaa agttcctcga agctagcttc agacgtgtct agataegtet 9420 
gctttttgtt gacttccatt gttcattcca eggacaaaaa cagagaaagg aaacgacaga 9480 
ggccaaaaag ctcgctttca gcacctgtcg tttcctttct tttcagaggg tattttaaat 9540 
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aaaaacatta agttatgacg aagaagaacg gaaacgcctt aaaccggaaa attttcataa 9600 
atagcgaaaa cccgcgaggt cgccgccccg taacaaggcg gatcgccgga aaggacccgc 9660 
aaatgataat aattatcaat tgcatactat cgacggcact gctgccagat aacaccaccg 9720 
gggaaacatt ccatcatgafc ggccgtgcgg acataggaag ccagttcatc catcgctttc 9780 
ttgtctgctg ccatttgctt tgtgacatcc agcgccgcac attcagcagc gtttttcagc 9840 
gcgttttcga tcaacgtttc aatgttggta tcaacaccag gtttaacttt gaacttatcg 9900 
gcactgacgg ttaccttgtt. ctgcgctggc tcatcacgca ggataccaag gctgatgttg 9960 
tagatattgg tcaccggctg agggttttcg attgccgctg cgtggatagc accatttgcg 10020 
atcaggcngt ccttgatgaa tgacactcca ttgcgaataa gttcgaagga gacggtgtca 10080 
cgaatgcgct ggtccagctc ggtcgattgc cttttgtgca gcagaggtat caatctcaac 10140 
gccaaggctc atcgaagcgc aatattgctg ctcaccaaaa cgcgtattga ccaggtgttc 102 00 
aacggcaaat ttctgccctt ctgatgtcag aaaggcaaag tgattttctt tctggtattc 1026O 
agttgctgtg tgtcggtttc agcaaaacca agctcgcgca attcggctgt gcagatttag 1032 0 
"j^^gggcagatc accagacagc aacggccaac ggaaaacagc gcatacagaa catccgtcgc 103 80 
■£|3»g cc gaca acgtgataat ttttatgacc catgatttat ttccttttag acgtgagcct 10440 
^^^tcgcacagc aaagccgccg aaagttcctc gaccgatgcc cttgagagcc ttcaacccag 10500 
tcagctcctt ccggtgggcg cggggcatga ctatcgtcgc cgcacttatg actgtcttct 10560 
ttatcatgca actcgtagga caggtgccgg cagcgctctg ggtcattttc ggcgaggacc 1062 0 
gctttcgctg gagcgcgacg atgatcggcc tgtcgcttgc ggtattcgga atcttgcacg 10680 
ccctcgctca agccttcgtc actggtcccg ccaccaaacg tttcggcgag aagcaggcca 10740 
ttatcgccgg catggcggcc gacgcgctgg gctacgtctt gctggcgttc gcgacgcgag 1080 0 
gctggatggc cttccccatt atgattcttc tcgcttccgg cggcatcggg atgcccgcgt 10860' 
tgcaggccat gctgtccagg caggtagatg acgaccatca gggacagctt caaggatcgc 1092 0 
tcgcggctct taccagccta acttcgatca ttggaccgct gatcgtcacg gcgatttatg 10980 
ccgcctcggc gagcacatgg aacgggttgg catggattgt aggcgccgcc ctataccttg 11040 
tctgcctccc cgcgttgcgt cgcggtgcat ggagccgggc cacctcgacc tgaatggaag 11100 
^^^cggcggcac ctcgctaacg gattcaccac tccaagaatt ggagccaatc aattcttgcg 1116 0 
■l JHgaactgtg aatgcgcaaa ccaacccttg gcagaacata tccatcgcgt ccgccatctc 1122 0 
^^Wagcagccgc acgcggcgca tctcgggcag cgttgggtcc tgcagatccg gctgtggaat 1128 0 
gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc 1134 0 
- atgcatctca attagtcagc aaccaggtgt ggaaagtccc caggctcccc agcaggcaga 11400 
agtatgcaaa gcatgcatct caattagtca gcaaccatag tcccgcccct aactccgccc 11460 
atcccgcccc taactccgcc cagttccgcc cattctccgc cccatggctg actaattttt 1152 0 
tttatttatg cagaggccga ggccgcctcg gcctctgagc tattccagaa gtagtgagga 1158 0 
ggcttttttg gaggcctagg cttttgcaaa a 11611 

<210> 5 
<211> 21 
<212> DNA 

<213> .Kunstliche Sequenz 
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<220> 

<223> Beschreibung der kiinstlichen Sequenz : Primer 
<400> 5 

cgatgtagga gggcgtggat a 21 



<210> 6 
' <211> 21 
•<212> DNA 

<213> Kiinstliche Sequenz 



"j^^20> 



3> Beschreibung der kiinstlichen Sequenz : Primer 



<400> 6 

gcttctgcgg gcgatttgtg t 21 




<210> 7 
<211> 20 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

23 > Beschreibung der kiinstlichen Sequenz : Primer 
<400> 7 

tgagaatatc accggaattg 20 



<210> 8 
<211> 21 
<212>.DNA 

<213> Kiinstliche Sequenz 



<220> 

<223> Beschreibung der- kiinstlichen Sequenz : Primer 

i 

<400> 8 
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agctcgacat actgttcttc c 21 

<210> 9 
<211> 24 
<212> DMA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kuns t lichen Sequenz : Primer 
<400> 9 

gtgaatggaa atcccatcgc tgtc 24 

^^210> 10 

<211> 24 
<212> DNA 

<213> Kainstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : Primer 
<400> 10 

agtgggtact ctaaaggcca tacc 24 



0> 11 
211> 1771 
<212> DNA 

<213> Haematococcus pluvialis 
<220> 

<221> CDS. 

<222> .(166) . . (1151) 

<223> 



<400> 11 

ggcacgagct tgcacgcaag tcagcgcgcg caagtcaaca cctgccggtc cacagcctca 60 



aataataaag agctcaagcg tttgtgcgcc tcgacgtggc cagtctgcac tgccttgaac 120 
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ccgcgagtct cccgccgcac tgactgccat agcacagcta gacga atg cag eta gca 177 

Met Gin Leu Ala 
1 

gcg aca gta atg' ttg gag cag ctt acc gga age get gag gca etc aag 225 
Ala Thr Val Met Leu Glu Gin Leu Thr Gly Ser Ala Glu Ala Leu Lys 
5 10 • 15 20 

gag aag gag aag gag gtt gca ggc age tct gac gtg ttg cgt aca tgg 2.73 
Glu Lys Glu Lys Glu Val Ala Gly Ser Ser Asp Val Leu Arg Thr Trp 
25 30 35 

§g acc cag tac teg ctt. ccg tea gaa gag tea. gac gcg gec cgc ccg 3 21 

Thr Gin Tyr Ser Leu Pro Ser Glu Glu Ser Asp Ala Ala Arg Pro 
40 45 50 

gga ctg aag aat gee tac aag cca cca cct tec gac aca aag ggc ate 3 69 

Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro Ser Asp Thr Lys Gly lie 
55 60 65 

aca atg gcg eta cgt gtc ate ggc tec tgg gec gca gtg ttc etc cac 
Thr Met . Ala Leu Arg Val He Gly Ser Trp Ala Ala Val Phe Leu His 
70 ' 75 80 

gec att ttt caa ate aag ctt ccg acc tec ttg gac cag ctg cac tgg 
a He Phe Gin He Lys Leu Pro Thr Ser Leu Asp Gin Leu His Trp 

90 95 100 

ctg ccc gtg tea gat gec aca get cag ctg« gtt age ggc acg age age 513 
Leu Pro Val Ser Asp Ala Thr Ala Gin Leu Val Ser Gly Thr Ser Ser 
105 110 " 115 

ctg etc gac ate gtc gta gta ttc ttt gtc ctg gag ttc ctg tac aca 5 61 

Leu Leu Asp He Val Val Val Phe Phe Val Leu Glu Phe Leu Tyr Thr 
120 125 130 




417 



465 



ggc ctt ttt ate acc acg cat gat get atg cat ggc acc ate gec atg 
Gly Leu Phe He Thr Thr His Asp Ala Met His Gly Thr He Ala Met 
135 140 145 



.609 
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aga aac agg cag ctt aat gac ttc ttg ggc aga gta tgc ate tec ttg 657 
Arg Asn Arg Gin Leu Asn Asp Phe Leu Gly Arg Val Cys lie Ser' Leu 
150 " 155 160 

tac gee tgg ttt gat tac aac atg ctg cac cgc aag cat tgg gag cac 7 05 

Tyr Ala Trp Phe Asp Tyr Asn Met Leu His Arg Lys His Trp Glu His 
165 170 175 180 

cac aac cac act ggc gag gtg ggc aag gac cct gac ttc cac agg gga 753 
His Asn His Thr Gly Glu Val Gly Lys Asp Pro Asp Phe His Arg Gly 
185 190 195 

aac cct ggc att gtg ccc tgg ttt gec age ttc atg tec age tac atg 8 01 

n Pro Gly lie Val Pro Trp Phe Ala Ser Phe Met Ser Ser Tyr Met 
200 205 210 

teg atg tgg cag ttt gcg cgc etc gca tgg tgg acg gtg gtc atg cag 849 
Ser Met Trp Gin Phe Ala Arg Leu Ala Trp Trp Thr Val Val Met Gin 
215 220 225 

ctg ctg ggt gcg cca atg gcg* aac ctg ctg gtg ttc atg gcg gee gcg 897 
Leu Leu Gly Ala Pro Met Ala Asn Leu Leu Val Phe Met Ala Ala Ala 
230 . 235 240 

ccc ate ctg tec gec ttc cgc ttg ttc tac ttt ggc acg tac atg ccc 945 
Pro lie Leu Ser Ala* Phe Arg Leu Phe Tyr Phe Gly Thr Tyr Met Pro 
^5 250 255 260 

cac aag cct gag cct ggc gec gcg tea ggc tct tea cca gee gtc atg 993 
His Lys Pro Girt Pro Gly Ala Ala Ser Gly Ser Ser Pro Ala Val Met 
265 ' 270 . 275 

aac tgg tgg aag teg cgc act age cag gcg tec gac ctg gtc age ttt 1041 
Asn Trp Trp Lys Ser Arg Thr Ser Gin Ala Ser Asp Leu Val Ser Phe 
' 280 285 290 

ctg acc tgc tac cac ttc gac ctg cac tgg gag cac cac cgc tgg ccc 1089 
Leu Thr Cys Tyr His Phe Asp Leu His Tip Glu His His Arg Trp Pro 
295 300 305 

ttc gec ccc tgg tgg gag ctg "ccc aac tgc cgc cgc ctg tct ggc cga 1137 
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Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys Arg Arg Leu Ser Gly Arg 
310 ' 315 320 

ggt ctg gtt cct gcc tag ctggacacac' tgcagtgggc cctgetgcca ■ 1185 

Gly Leu Val Pro Ala 

325 

gctgggcatg caggttgtgg caggactggg tgaggtgaaa agctgcaggc gctgctgccg 1245 

gacacgctgc atgggctacc ctgtgtagct gccgccacta ggggaggggg tttgtagctg 1305 

tcgagcttgc cccatggatg aagctgtgta gtggtgcagg gagtacaccc acaggccaac . 1365 

^cttgcag gagatgtctt gcgtcgggag gagtgttggg cagtgtagat gctatgattg 1425 

tatcttaatg ctgaagcctt taggggagcg acacttagtg ctgggcaggc aacgccctgc 1485 

aaggtgcagg cacaagctag . gctggacgag gactcggtgg caggcaggtg aagaggtgcg 1545 

ggagggtggt gccacaccca ctgggcaaga ccatgctgca atgctggcgg tgtggcagtg 1605 
agagctgcgt gattaactgg gctatggatt gtttgagcag tctcacttat tctttgatat 1665 
agatactggt caggcaggtc aggagagtga gtatgaacaa gttgagaggt ggtgcgctgc 1725 
ccctgcgctt. atgaagctgt aacaataaag tggttcaaaa aaaaaa ■ 1771 



<210> 12 



<211> 329 



<212> PRT 





<213> Haematococcus pluvialis 



<400> 12 

•Met Gin Leu Ala Ala Thr Val Met Leu Glu. Gin Leu Thr Gly Ser Ala 
1 5 10 15 
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Glu Ala Leu Lys Glu Lys Glu Lys Glu Val Ala Gly Ser Ser Asp Val 
20 25 30 



Leu Arg Thr Trp Ala Thr Gin Tyr .'Ser Leu Pro Ser Glu Glu Ser Asp 
35 40 45 



Ala Ala Arg Pro Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro Ser Asp 
50 55 60 




Lys Gly He Thr Met Ala Leu Arg Val He Gly Ser Trp Ala Ala 
70 75 80 



Val Phe Leu His Ala He Phe Gin lie Lys Leu Pro. Thr Ser Leu Asp 
85 90 95 



Gin Leu His Trp Leu Pro Val Ser Asp Ala Thr Ala Gin Leu Val Ser 
100 105 110 



Gly Thr Ser Ser Leu Leu Asp He Val Val Val Phe Phe Val Leu Glu 
115 120 125 



Phe Leu Tyr Thr Gly Leu Phe lie* Thr Thr His Asp Ala Met His Gly 
130 135 140 




Thr He Ala Met -Arg Asn Arg Gin Leu Asn Asp Phe Leu Gly Arg Val 
145 150 155 160 



Cys He Ser Leu Tyr Ala Trp Phe Asp Tyr Asn "Met Leu His Arg Lys 
165 170 175 
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His Trp Glu His His Asn -His 1<hr Gly Glu Val. Gly Lys Asp Pro Asp 
180 185 190 

Phe His Arg Gly Asix Pro Gly lie Val Pro Trp Phe Ala Ser Phe Met 
195 200 205 



Ser Ser Tyr Met Ser Met Trp Gin Phe Ala Arg Leu Ala Trp Trp Thr 
210 215 220 

Val Val Met Gin Leu Leu Gly Ala Pro Met Ala Asn Leu Leu Val Phe • 
N 225 230 235 240 

Met Ala Ala Ala Pro lie Leu Ser Ala Phe. Arg Leu Phe Tyr Phe Gly 
245 250 255 

Thr Tyr Met Pro His" Lys Pro Glu Pro Gly Ala Ala Ser Gly Ser' Ser 
.260 265 270 



Pro Ala Val Met Asn Trp Trp Lys Ser Arg Thr* Ser Gin Ala Ser' Asp 
275 280 285 

^^^^jl Val Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His Trp Glu. His 
290 295 300 



His Arg Trp Pro Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys Arg Arg 
305 310 315 320 



Leu Ser Gly Arg Gly Leu Val Pro Ala 
325 
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<210> 13 

<211> 1662 

<212> DNA 

<213> Haematococcus pluvialis 



<220> 



<221> CDS 



• 



2> (168) (1130) 




<223> 



<400> 13 

cggggcaact caagaaattc aacagctgca agcgcgcccc agcctcacag cgccaagtga 60 

gctatcgacg tggttgtgag cgctcgacgt ggtccactga cgggcctgtg agcctctgcg 120 

ctccgtcctc tgccaaatct cgcgtcgggg cctgcctaag tcgaaga atg cac gtc 176 

Met His Val 
1 

gca teg gca eta atg gtc gag cag aaa ggc agt gag gca get get tec 224 
Ala Ser Ala Leu Met Val Glu Gin Lys Gly Ser Glu Ala Ala Ala Ser 
5 10 15 

age cca gac gtc ttg aga gcg tgg gcg aca cag tat cac atg cca tec 272 
Ser Pro Asp Val Leu Arg Ala Trp Ala Thr Gin Tyr His Met Pro Ser 
20 25 30 35 

.gag teg tea gac gca get cgt cct gcg eta aag cac gee tac aaa cct 320 
Glu Ser Ser Asp Ala Ala Arg Pro Ala Leu Lys His Ala Tyr Lys Pro 
40 45 50 

cca gca tct gac gee aag ggc ate acg.atg gcg ctg acc ate att ggc 368 
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Pro Ala.Ser Asp Ala Lys Giy lie Thx Met Ala Leu Thr lie lie .Gly 
55 60 65 

ace tgg acc gca gtg ttt tta cac gca ata ttt caa ate agg eta ccg 416 
Thr Trp Thr Ala Val Phe Leu His Ala lie Phe Gin He Arg Leu Pro 
70 75 80 

aca tec atg gac cag ctt cac tgg ttg cct gtg tec gaa gee aca gec 464 • 

Thr Ser Met Asp Gin Leu His Trp Leu Pro Val Ser Glu Ala Thr Ala 
85 90 95 

cag ctt ttg ggc gga age age age eta ctg cac ate get gca gtc ttc 512 
Gin Leu Leu Gly Gly Ser Ser Ser Leu Leu His He Ala Ala Val Phe 
0 105 110 115 

i 

att gta ctt gag ttc ctg tac act ggt eta ttc ate- acc aca cat gac 560 

He Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe He Thr Thr His Asp 
X20 125 . 13,0 

gca atg cat ggc acc ata get ttg agg cac agg cag etc aat gat etc 608 
Ala Met His Gly Thr He Ala Leu Arg His Arg Gin Leu Asn Asp Leu 
135 ■ 140 * 145 

ctt ggc aac ate tgc ata tea ctg tac gee tgg ttt gac tac age atg 656 
Leu Gly Asn He Cys He Ser Leu Tyr Ala Trp Phe Asp Tyr Ser Met 
150 155 160 

g cat cgc aag cac tgg gag cac cac aac cat act ggc gaa gtg ggg 7 04 

Leu His Arg Lys His Trp Glu His His Asn His Thr Gly Glu Val Gly 
165 170 . 175 

aaa gac cct gac ttc cac aag gga aat ccc ggc ctt gtc ccc tgg ttc 7 52 

Lys Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val Pro Trp Phe 
180 185 190 195 

•gee age ttc atg tec age tac atg tec ctg tgg cag ttt gee egg ctg 800 
Ala Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gin Phe Ala Arg Leu 
200 205 210 




gca tgg tgg gca gtg gtg atg caa atg ctg ggg gcg ccc atg gca aat 
Ala Trp Trp Ala Val Val Met Gin Met Leu Gly Ala Pro Met Ala Asn 



848 
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-215 220 225 

etc eta gtc ttc atg get gca gec cca ate ttg tea gca ttc cgc etc 89 6 

Leu Leu Val Phe Met Ala Ala Ala Pro He Leu Ser Ala Phe Arg Leu 
230 235 240 

ttc tac ttc ggc act tac ctg cca cac aag cct gag cca ggc cct gca 944 
Phe Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro Gly Pro Ala 
245 250 255 

gca ggc tct cag gtg atg gec tgg'ttc agg gec aag aca agt gag gca 992 
Ala Gly Ser Gin Val Met Ala Trp Phe Arg Ala Lys Thr Ser Glu Ala 
260 265 270 275 



gat gtg atg agt ttc ctg aca tgc tac cac ttt gac ctg cac tgg 
r Asp Val Met Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His Trp 
280 285 290 



1040 



1088 



gag cac cac agg tgg ccc ttt gec ccc tgg tgg cag ctg ccc cac tgc 
Glu His His Arg Trp Pro Phe Ala Pro Trp Trp Gin Leu Pro His Cys 
295 300 305 

cgc cgc ctg tec ggg cgt ggc ctg gtg cct gee ttg gca tga 1130 
Arg Arg Leu Ser Gly Arg Gly Leu Val Pro Ala Leu Ala 
310 ■ 315 320 



cctggtccct ccgctggtga cccagcgtct gcacaagagt gtcatgetae agggtgctgc 1190 

^ccagtggc agcgcagtgc actctcagcc tgtatggggc taccgctgtg ccactgagca 12 50 

ctgggcatgc cactgagcac tgggcgtgct actgagcaat gggcgtgcta ctgagcaatg 1310 

ggcgtgctac tgacaatggg cgtgctactg gggtctggca gtggctagga tggagtttga 1370 

tgcattcagt agcggtggcc aacgtcatgt ggatggtgga agtgctgagg ggtttaggca 1430 

geeggcattt gagagggcta agttataaat cgcatgctgc tcatgcgcac atatctgeae 1490 



acagecaggg aaatcccttc gagagtgatt atgggacact tgtattggtt tegtgetatt 
gttttattca gcagcagtac ttagtgaggg tgagagcagg gtggtgagag tggagtgagt 



1550 
1610 
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gagtatgaac ctggtcagcg aggtgaacag cctgtaatga atgactctgt ct 16 62 

<210> 14 

<211> 320 

<212> PRT 

<213> Haematococcus pluvialis 




0> 14 



Met His Val Ala Ser Ala Leu Met Val Glu Gin Lys Gly Ser Glu Ala 
15 10 15 . 



Ala Ala Ser Ser Pro Asp Val Leu Arg Ala Trp Ala Thr Gin Tyr His 
20 25 30 



Met Pro Ser Glu Ser Ser Asp Ala Ala Arg Pro Ala Leu Lys His Ala 
35 40 .45 



Lys Pro Pro Ala Ser Asp Ala Lys Gly lie Thr Met Ala Leu Thr 
50 55 60 



lie lie Gly Thr Trp Thr Ala Val Phe Leu His Ala lie Phe Gin lie 
65 70 75 80 



Arg Leu Pro Thr Ser Met Asp Gin Leu His Trp Leu Pro Val Ser Glu 
85 90 95 



Ala Thr Ala Gin Leu Leu Gly Gly Ser Ser Ser Leu Leu His He Ala 
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100 



105 



110 



Ala Val Phe lie Val Leu Glu Phe Leu Tyx Thr Gly Leu Phe He Thr 
115 120 125 



Thr His Asp Ala Met His Gly Thr He Ala Leu Arg His Arg Gin Leu 
130 135 140 



Asn Asp Leu Leu Gly Asn He Cys lie Ser Leu Tyr Ala Trp Phe Asp 
145 150 155 ' 160 



Tyr Ser Met Leu His Arg Lys His Trp Glu His His Asn His Thr Gly 
165 170 175 




Glu Val Gly Lys Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val 
180 185 190 



Pro Trp Phe Ala Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gin Phe 
195 200 205. 



Arg Leu Ala Trp Trp Ala Val Val Met Gin Met Leu Gly Ala Pro 
210 215 220 



Met Ala Asn Leu Leu Val Phe Met* Ala Ala Ala Pro He Leu Ser Ala 
225 230 235 240 



Phe Arg Leu Phe Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro 
245 250 255 



Gly Pro Ala Ala Gly Ser Gin Val Met Ala Trp Phe Arg Ala Lys Thr 
260 265 . 270 
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Ser Glu Ala Ser Asp Val Met Ser Phe Leu Thr Cys Tyr His Phe Asp 
275 280 285 



Leu His Trp Glu His His Arg Trp Pro. Phe Ala Pro Trp Trp Gin Leu 
290 295 300 



Pro His Cys Arg Arg Leu Ser ' Gly Arg Gly Leu Val Pro Ala Leu Ala 
305 310 315 320 



10> 15 



<211> 729 



<212> DNA 




<213> Agrobacterium aur ant i acum 

<220> 

<221> CDS 

22> (1)..(729) 
<223> 



<400> 15 

atg age gca cat gec ctg ccc aag gca gat ctg acc gec acc age ctg 48 

Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 

1 5 10. 15 

ate gtc teg ggc ggc ate ate gee get tgg ctg gee ctg cat gtg cat 96 
lie Val Ser Gly Gly lie lie Ala Ala Trp Leu Ala Leu His Val His 
20 .25 30 
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gcg ctg tgg ttt ctg gac gca gcg gcg cat ccc ate ctg gcg ate gca 144. 
Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro lie Leu Ala lie Ala * 
• 35 40 45 

aat ttc ctg ggg ctg acc tgg ctg teg gtc gga ttg ttc ate ate gcg 192 
Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
50 55 60 

cat gac gcg atg cac ggg teg gtg gtg ccg ggg cgt ccg cgc gee aat 240 
His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 -75 80 



g gcg atg ggc cag ctt gtc ctg tgg ctg tat gee gga ttt teg tgg 2 88 

Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 



cgc aag atg ate gtc aag cac atg gee cat cac cgc cat gee gga acc 336 
Arg Lys Met He Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 ' 105 HO 

gac gac gac ccc gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gee 3 84 

Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 



^^r< 



cgc ttc ate ggc acc tat ttc ggc tgg cgc gag ggg ctg ctg. ctg ccc 
g Phe lie Gly Thr Tyr Phe Gly Trp Arg. Glu Gly Leu Leu Leu Pro 
130 ' 13 5 140 



432 



480 



528 



gtc ate gtg acg gtc tat gcg ctg ate ctt ggg gat cgc tgg atg tac 
Val He Val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 

gtg gtc' ttc tgg ccg ctg ccg teg ate ctg gcg teg ate cag ctg ttc 
Val Val Phe Trp Pro Leu Pro Ser He Leu Ala Ser He Gin Leu Phe 
165 170 175 

gtg ttc ggc acc tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg 57 6 

Val* Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180. 185' 190 

gac cgc cac aat gcg egg teg teg egg ate age gac ccc gtg teg ctg 624 
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<210> 16 

<211> 242 

<212> PRT- • 

<213> Agrobacterium aurantiacum 



672 



Asp Arg His Asn Ala Arg Ser Ser Arg lie Ser Asp Pro Val Ser Leu 
195 .200 205 

ctg acc tgc ttt cac ttt ggc ggt tat cat cac gaa cac cac ctg cac 
Leu Tbr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 

ccg acg gtg ccg tgg.tgg cgc ctg ccc age acc cgc acc aag ggg gac 720 
Pro Thr Val Pro T^p Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 

acc gca tga 729 
Thr Ala 



<400> 16 




Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 



He Val Ser Gly Gly He He Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 



Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro He Leu Ala He Ala 

35 "40 . • 45 



Asn Phe. Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe "He He Ala 
50 55 60 
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His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 -80 



Ala Ala- Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 



Arg Lys Met lie Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 - 105 110 



• Asp Asp Pro Asp Phe Asp His 
115 120 

Arg Phe He Gly - Thr Tyr Phe Gly 
130 135 - 



Val He Val Thr Val Tyr Ala Leu 
145 • 150 



Val Val Phe Trp Pro Leu Pro Ser 




165 



Val Phe Gly Thr Trp Leu Pro His 
180 



Asp Arg His Asn Ala Arg Ser Ser 
195 200 



Gly Gly Pro Val Arg Trp Tyr Ala 
125 



Trp Arg Glu Gly Leu Leu Leu Pro 
140 • 



He Leu Gly Asp Arg Trp Met Tyr 
155 160 



He Leu Ala Ser He Gin Leu Phe 
170 175 



Arg Pro Gly His Asp Ala .Phe Pro 
185 190 



Arg lie Ser Asp Pro Val Ser Leu 
205 



Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 
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Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thx Lys Gly Asp 
225 230 235 240 • 



Thr Ala 



<210> 17 



<211> 1631 



<212> DNA 



3> Alcaligenes sp. 



<220> 



<221> CDS 



<222> (99).. (827) 
<223> 




<400> 17 

ctgcaggccg ggcccggtgg ccaatggtcg caaccggcag gactggaaca ggacggcggg 60 

ccggtctagg ctgtcgccct acgcagcagg agtttcgg atg tec gga egg aag cct 116 

Met Ser Gly Arg Lys Pro 
1 5 

ggc aca act ggc gac acg ate gtc aat etc ggt ctg acc gee gcg ate 164 
Gly Thr Thr Gly Asp Thr lie Val Asn Leu Gly Leu Thr Ala Ala lie 
10 15 20 



ctg ctg tgc. tgg ctg gtc ctg cac gee ttt acg eta tgg ttg eta gat 



212 
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Leu Leu Cys Trp Leu Val Leu His Ala Phe Thr Leu Trp Leu Leu Asp 
25 30 35 

gcg gcc gcg cat ccg ctg cfct gcc gtg ctg tgc ctg get ggg ctg acc 2 60 

Ala Ala Ala His Pro Leu Leu Ala Val Leu Cys Leu Ala Gly Leu Thr • 
40 45 50 

tgg ctg teg gtc ggg ctg ttc ate ate gcg cat gac gca atg cac ggg . 308 
Trp Leu Ser Val Gly Leu Phe lie He Ala His Asp Ala Met His Gly 
55 60 65 70 

tec gtg gtg ccg ggg egg ccg cgc gcc aat gcg. gcg -ate ggg caa ctg 356 
Ser Val Val Pro Gly Arg Pro Arg Ala Asn Ala Ala He Gly Gin Leu 
75. • 80 85 

gcg ctg tgg etc tat gcg ggg ttc teg tgg ccc aag ctg ate gcc aag 404 
Ala Leu Trp Leu Tyr Ala Gly Phe Ser Trp Pro Lys Leu He Ala Lys 
90 95 100 

cac atg acg cat cac egg cac gcc ggcacc gac aac gat ccc* gat ttc 452 
His Met Thr His His Arg His Ala Gly Thr Asp Asn Asp Pro Asp Phe 
105 ' 110 115 

ggt cac gga ggg ccc gtg cgc tgg tac ggc age ttc gtc tec acc tat 500 
Gly His Gly Gly Pro Val Arg Trp Tyr Gly Ser Phe Val Ser Thr Tyr 
120 125 130 

c ggc tgg cga gag gga ctg ctg eta ccg gtg ate gtc acc acc tat 548 
Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro Val He Val Thr Thr Tyr' 
135 140 145 150 




gcg ctg ate ctg ggc gat cgc tgg atg tat gtc ate ttc tgg ccg gtc 596 
Ala Leu He Leu Gly Asp Arg Trp Met Tyr Val He Phe Trp Pro Val 
155 160 165 

ccg gcc gtt- ctg gcg teg ate cag att ttc gtc ttc gga act tgg ctg 644 
Pro Ala Val Leu Ala Ser He Gin He Phe Val Phe Gly Thr Trp Leu 
170 175 180 

ccc cac cgc ccg gga cat gac gat ttt ccc gac egg cac aac gcg agg 692 
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Pro His Arg Pro Gly His Asp Asp Phe Pro Asp Arg His Asri Ala Arg 
185 190 195 



teg acc ggc ate ggc gac ccg ttg tea eta ctg ace tgc ttc cat ttc 
Ser Thr Gly He Gly Asp Pro Leu Ser Leu Leu Thr Cys Phe His Phe 
200 205 210 

ggc ggc tat cac cac gaa cat cac ctg cat ccg cat gtg ccg tgg tgg 
Gly Gly Tyr His His Glu His His Leu His Pro His Val Pro Trp Trp 
215 220 225 230 

cgc ctg cct cgt aca cgc aag acc gga ggc cgc gca tga cgcaattcct 
Arg Leu Pro Arg Thr Arg Lys Thr Gly Gly Arg Ala 
235 240 




740 



788 



837 



cattgtcgtg gcgacagtcc tcgtgatgga gctgaccgcc tattccgtcc acegctggat 897 

tatgeaegge cccctaggct ggggctggca caagtcccat cacgaagagc acgaccacgc 957 

gttggagaag aacgacctct aeggegtegt ettcgeggtg ctggcgacga tcctcttcac 1017 

cgtgggcgcc tattggtggc cggtgctgtg gtggatcgcc ctgggcatga eggtctatgg 1077 

gttgatctat ttcatcctgc aegaeggget tgtgcatcaa cgctggccgt tteggtatat 1137 

tccgcggcgg ggctatttcc gcaggctcta ccaagctcat cgcctgcacc aegeggtega 1197 

^Jj^gcgggac cactgcgtca getteggett catctatgcc ccacccgtgg acaagctgaa 12 57 

gcaggatctg aageggtegg gtgtcctgcg cccccaggac gagegtcegt cgtgatctct 1317 

gatcccggcg tggccgcatg aaatccgacg tgctgctggc aggggcegge cttgccaacg 1377 

gaetgatege getggegate cgcaaggcgc ggcccgacct tcgcgtgctg ctgctggacc 1437 

gtgcggcggg cgcctcggac gggcatactt ggtcctgcca cgacaccgat ttggcgccgc 1497 

actggctgga ccgcctgaag ccgatcaggc gtggcgactg gcccgatcag gaggtgcggt 15 57 

tcccagacca ttcgegaagg ctccgggccg gatatggctc gatcgaeggg egggggctga 1617 
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tgcgtgcggt gacc 1631 

<210> 18 
<211> 242 
<212> PRT . 

<213> . Alcaligenes sp. 



^4 0 



400> 18 



t Ser Gly Arg Lys Pro Gly Thr Thr Gly Asp Thr lie Val Asn Leu 
1 5 10 15 



Gly Leu Thr Ala Ala lie Leu- Leu Cys Trp Leu Val Leu His Ala Phe 
20 25 30 



Thr Leu Trp Leu Leu Asp Ala Ala Ala His Pro Leu Leu Ala Val Leu 
' 35 40 45 




is Leu Ala Gly Leu Thr Trp Leu Ser Val Gly Leu Phe lie lie Ala 
50 55 60 



His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 



.Ala- Ala lie Gly Gin Leu Ala Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 



' Pro Lys Leu lie Ala Lys His Met Thr His His Arg His Ala Gly Thr 
100 105 110 
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Asp Asn Asp Pro Asp Phe Gly His Gly Gly Pro Val Arg Trp Tyr Gly 
115 120 125 



Ser Phe Val Ser Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 



Val lie Val Thr Thr Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155. ' 160 



He Phe Trp Pro Val Pro Aia Val Leu Ala Ser He Gin He Phe 
165 170 175 



Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His. Asp Asp Phe Pro 
180 185 190 



Asp Arg His Asn Ala Arg Ser Thr Gly He Gly Asp Pro Leu Ser Leu 
195 200 . 205 




Leu Thr Cys Phe His Phe Gly Gly Tyr His His , Glu His His Leu His 
210 215 ' 220 



Pro His Val Pro Trp Trp Arg Leu Pro Arg Thr Arg Lys Thr Gly Gly 
225 230 235 • 240 



Arg Ala 



<210> 19 



<211> .729 
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<212> DNA 

<213> Paracoccus marcusii 



<220> 

<221> CDS 

<222> (1) . . (729) 



<223> 




<400> 19 

atg age gca cat gec ctg ccc aag gca gat ctg acc gec aca age ctg 48 
Met Ser Ala His Ala Leu Pro. Lys Ala Asp Leu Thr Ala Thr Ser Leu 
1 5 ' 10 15 

ate gtc teg ggc ggc ate ate gee gca. tgg ctg gee ctg cat gtg cat- 96 
lie Val Ser Gly Gly lie lie Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 

gcg ctg tgg ttt ctg gac gcg gcg gec cat ccc ate ctg gcg gtc gcg 144 
Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro He Leu Ala Val Ala 
35 ' 40 45 

aat ttc ctg ggg ctg acc tgg ctg teg gtc gga ttg ttc ate ate gcg 192 
Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
50 55 60 ' 

cat gac gcg atg cac ggg teg gtc gtg ccg ggg cgt ecg cgc gec aat 240 
His Asp Ala Met His Gly Ser Val Val*. Pro Gly Arg Pro Aarg Ala Asn 
65 70 75 80 

gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gec gga ttt teg tgg 288 
Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 




cgc aag atg ate gtc aag cac atg gee cat cac cgc cat gee gga acc 



336 
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Arg Lys Met lie Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 HO 

gac gac gac cca gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gcc 384 
Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 

cgc ttc ate ggc acc tat ttc ggc tgg cgc gag ggg ctg ctg ctg ccc 432 
Arg 'Phe lie Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 

gtc ate gtg acg gtc tat gcg ctg ate ctg ggg gat cgc tgg atg tac 
Val lie Val -Thr Val Tyr Ala Leu lie Leu Gly Asp Arg Trp Met Tyr 

150 155 160 ' . 

gtg gtc ttc tgg ccg ttg ccg teg ate ctg gcg- teg ate cag ctg ttc 
Val Val Phe Trp Pro Leu Pro Ser lie Leu Ala Ser lie Gin Leu Phe 
165 170 175 

gtg ttc ggc act tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg 57 6 

Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 ' 190 





gac cgc cat aat gcg egg teg teg egg ate age gac cct gtg teg ctg 
Asp Arg His Asn Ala Arg Ser Ser Arg lie Ser Asp Pro Val Ser Leu 
195 200 205 

:g acc tgc ttt cat ttt ggc ggt tat cat cac gaa cac cac ctg cac 
Leu Thr Cys Phe His Phe. Gly Gly Tyr His His Glu His His Leu His 
210 215 220 

•ccg acg gtg ccg tgg tgg cgc ctg ccc age acc cgc acc aag ggg gac 
Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 



480 



528 



624 



672 



720 



acc gca tga 
Thr Ala 
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<210> 20 



<211> 242 
<212> PRT ■ 

<213> Paracoccus marcusii 



<400> 20 

Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
15 10 15 



Val Ser Gly Gly He He Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 



Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro He Leu Ala Val Ala 
35 -40 45 




Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
50 55 60 




s Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 

70 75 80 



Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 



Arg Lys Met He Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 110 



Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 
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Arg Phe lie Gly Tlir Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 



Val lie Val Thr Val Tyr Ala Leu lie Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 



Val Val Phe Trp Pro Leu Pro Ser lie Leu Ala Ser lie Gin' Leu Phe 
165 170 175 




Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 




Asp Arg His Asn Ala Arg Ser Ser Arg lie Ser Asp Pro Val. Ser Leu 
195 200 ' 205 



Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
. 210 215 220 



o Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
'25 230 235 240 



Thr Ala 



<210> 21 
<211> 16'29 
<212> DNA 
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<213> Synechococcus sp. 

<220> 

<221> CDS 

<222> (1)..(1629) 

<223> 




<400> 21 

>g ate acc acc gat gtt gtc att att ggg gcg ggg cac aat ggc tta 

t He Thr Thr Asp Val Val He He Gly Ala Gly His Asn Gly Leu 

x 5 10 I 5 

gtc tgt gca gec tat ttg etc caa egg ggc ttg ggg gtg acg tta eta 
Val Cys Ala Ala Tyr Leu Leu Gin Arg Gly Leu Gly Val Thr Leu Leu 
20 25 ' -30 

gaa aag egg gaa gta cca ggg ggg gcg gee acc ac'a gaa get etc atg 
Glu Lys Arg Glu Val Pro Gly Gly Ala Ala Thr Thr Glu Ala Leu Met 
35 40 45 . 

ccg gag eta tec ccc cag ttt cgc ttt aac cgc tgt gee att gac cac 
o Glu Leu Ser Pro Gin Phe Arg Phe Asn Arg Cys Ala He Asp His 
50 55 60 

gaa ttt ate ttt ctg ggg ccg gtg ttg cag gag eta aat tta gee cag 
Glu Phe He Phe Leu Gly Pro Val Leu Gin Glu Leu Asn Leu Ala Gin 
65 -70 75 -80 

tat ggt ttg gaa tat tta ttt tgt gac ccc agt gtt ttt tgt ccg ggg 
Tyr Gly Leu Glu Tyr Leu Phe Cys Asp Pro Ser Val Phe Cys Pro Gly 
85 90 95 




48 



96 



144 



192 



240 



288 



ctg gat ggc caa get ttt atg age tac cgt tec eta gaa aaa acc tgt 
Leu Asp Gly Gin Ala Phe Met Ser Tyr Arg Ser Leu Glu Lys Thr .Cys 
100 ' 105 HO 



336 
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gcc'cac att gcc acc tat age ccc cga gat gcg gaa aaa tat egg caa 
Ala His He Ala Thr Tyr Ser Pro Arg Asp Ala Glu Lys Tyr Arg Gin 
115 120 125 

ttt gtc aat tat tgg acg gat ttg etc aac get gtc cag cct get ttt 
Phe Val Asn Tyr Trp Thr Asp Leu Leu Asn Ala Val Gin Pro Ala Phe 
130 135 140 

aat get ccg ccc cag get tta eta gat tta gcc ctg aac tat ggt tgg 
Asn Ala Pro Pro Gin Ala Leu Leu Asp Leu Ala Leu Asn Tyr Gly Trp 
145 150 155 160 



craa 

w 



aaa aac tta aaa tec gtg ctg gcg ate gcc ggg teg aaa acc aag gcg 
Asn Leu Lys Ser Val Leu Ala He Ala Gly Ser Lys Thr Lys. Ala 
165 170 I" 75 



ttg gat ttt ate cgc act atg ate ggc tec ccg gaa gat gtg etc aat 
Leu Asp Phe He Arg Thr Met He Gly Ser Pro Glu Asp Val Leu Asn 
. 180 ' 185 " 1^0 

gaa tgg ttc gac age gaa egg "gtt aaa get cct tta get aga eta tgt 
Glu Trp Phe Asp Ser Glu Arg Val Lys Ala Pro Leu Ala Arg Leu Cys 
195 . 200 205 

teg gaa att ggc get ccc cca tec caa aag ggt agt age tec ggc atg 
Ser Glu lie Gly Ala Pro Pro Ser Gin Lys Gly Ser Ser Ser Gly Met 
210 215 220 

atg atg gtg gcc atg egg cat ttg gag gga att gcc aga cca aaa gga 
Met Met Val Ala Met Arg His Leu Glu" Gly lie Ala Arg Pro Lys Gly 
225 230 . 235 240 

ggc act gga gcc etc' aca gaa gcc ttg gtg aag tta gtg caa gcc caa 
Gly Thr Gly Ala Leu Thr Glu Ala Leu' Val Lys Leu Val Gin Ala Gin 
245 250 255 

ggg gga aaa ate etc act gac caa acc gtc aaa egg gta ttg gtg gaa 
Gly Gly Lys He Leu Thr Asp Gin Thr Val Lys Arg Val Leu Val Glu 
260 265 270 




384 



432 



480 



528 



576 



624 



672 



720 



768 



816 



aac aac cag gcg ate ggg gtg gag gta get aac gga gaa cag 



864 





1056 
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Asn Asn Gin" Ala He Gly Val Glu Val Ala Asn Gly Glu Gin Tyr Arg 
275 280 285 

gcc aaa aaa ggc gtg att tct aac ate gat gec cgc cgt tta ttt ttg 912 
Ala Lys Lys Gly Val He Ser Asn He Asp Ala Arg Arg Leu Phe Leu 
290 . 295 300 

caa ttg gtg gaa ccg ggg gcc eta gcc aag gtg aat caa aac eta ggg 960 
Gin Leu Val Glu Pro Gly Ala Leu Ala Lys Val Asn Gin Asn Leu Gly 
305 310 315 320 

gaa cga ctg gaa egg cgc act gtg aac aat aac gaa gcc att tta aaa 1008 
Glu Arg Leu Glu Arg Arg Thr Val Asn Asn Asn Glu Ala He Leu Lys 
325 330 335 

ate gat tgt gcc etc tec ggt tta ccc cac ttc act gcc atg gcc ggg 
He Asp Cys Ala Leu Ser Gly Leu Pro His Phe Thr Ala Met Ala Gly 
340 345 •■ 350 

ccg gag gat eta acg gga act att ttg att gcc gac teg gta cgc cat 
Pro Glu Asp Leu Thr Gly Thr He Leu He Ala Asp Ser Val Arg His 
355 360 365 

gtc gag gaa gcc cac gcc etc att gcc ttg ggg caa att ccc gat get 1152 
Val <3lu^ Glu Ala His Ala Leu He Ala Leu Gly Gin He Pro Asp Ala 
370 375 380 

t ccg tct tta tat ttg gat att ccc act gta ttg gac ccc ace atg 1200 
Asn Pro Ser Leu Tyr Leu Asp He Pro Thr Val. Leu Asp Pro Thr Met 
385 390 395 400 

gcc ccc cct ggg cag cac ace etc tgg ate gaa ttt ttt gcc ccc tac 1248 
Ala Pro Pro Gly Gin His Thr Leu Trp He Glu Phe Phe Ala Pro Tyr 
405 410 • 415 

cgc ate gcc ggg ttg gaa ggg aca ggg tta atg ggc aca ggt tgg acc 1296 
Arg He Ala Gly Leu Glu Gly Thr Gly Leu Met Gly Thr Gly Trp Thr 
420 425 430 

gat gag tta aag gaa aaa gtg gcg gat egg gtg att gat. aaa tta acg 1344 
Asp Glu Leu Lys Glu- Lys Val Ala Asp Arg Val He Asp Lys Leu Thr 



1104 
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435 440 445 

gac tat gcc cct aac eta aaa tct ctg ajtc att ggt cgc cga gtg gaa 1392 
Asp Tyr Ala Pro Asn Leu Lys Ser Leu lie lie Gly Arg Arg Val Glu 
•450 455 460 

agt ccc gcc gaa ctg gcc caa egg ctg gga agt tac aac ggc aat gtc 1440 
Ser Pro Ala Glu Leu Ala Gin Arg Leu Gly Ser Tyr Asn Gly Asn Val 
465 470 . 475 480 

tat cat ctg gat atg agt ttg gac caa atg atg ttc etc egg cct eta 1488 
Tyr His Leu Asp Met Ser Leu Asp Gin Met Met Phe Leu Arg Pro Leu 
485 490 495 

g gaa att gcc aac tac caa ace ccc ate aaa aat ctt tac tta aca 1536 
Pro Glu lie Ala Asn Tyr Gin Thr Pro He Lys Asn Leu Tyr Leu Thr 
. 500 505 510 

ggg gcg ggt ace cat ccc ggt ggc tec ata tea ggt atg ccc ggt aga 1584 
Gly Ala Gly Thr His Pro Gly Gly Ser He Ser Gly Met Pro Gly Arg 
515 520 525 





aat tgc get egg gtc ttt tta aaa caa caa cgt cgt ttt tgg taa 
Asn Cys Ala Arg Val Phe Leu Lys Gin Gin Arg Arg Phe Trp 
530 535 540 



210> 22 



<211> 542 
<212> PRT 

<213> Synechoeoccus sp. 
<400> 22 

Met He Thr Thr Asp Val Val He He Gly Ala Gly His Asn Gly Leu 
1 5 10. 15 



1629 
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Val Cys Ala Ala Tyr Leu Leu Gin Arg Gly Leu Gly Val Thr Leu Leu 
20 25 30 



Glu Lys Arg Glu Val Pro Gly Gly Ala Ala Thr Thr Glu Ala Leu Met 
35 40 45 



Pro Glu Leu Ser Pro Gin Phe Arg Phe Asn Arg Cys Ala lie Asp His 
50 55 " .60 



Phe lie Phe Leu Gly Pro Val Leu Gin Glu Leu Asn Leu Ala Gin' 
r 5 70 75 80 



Tyr Gly Leu Glu Tyr Leu Phe Cys Asp Pro Ser Val Phe Cys Pro Gly 
85 90' 95 



Leu Asp Gly Gin Ala Phe Met Ser Tyr Arg Ser Leu Glu Lys Thr Cys 
100 105 ' 110 




Ala His lie Ala Thr Tyr Ser Pro Arg Asp Ala Glu Lys Tyr Arg Gin 
115 120 125 



Phe - Val Asn Tyr Trp Thr Asp Leu Leu Asn Ala Val Gin Pro Ala Phe 
130 135 140 



Asn Ala Pro Pro Gin Ala Leu Leu Asp Leu Ala Leu Asn Tyr Gly Trp 
145 150 ' 155 160 



Glu Asn Leu Lys Ser Val Leu Ala lie Ala Gly Ser Lys Thr Lys Ala 
165 170 175 
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Leu Asp Plie He Arg Thr Met He 
180 

Glu Trp Phe Asp Ser Glu Arg Val 
195 200 



Gly Ser Pro Glu Asp Val Leu Asn 
185 190 



Lys Ala Pro Leu Ala Arg Leu Cys 
205 



Ser Glu He Gly Ala Pro Pro Ser Gin Lys Gly Ser Ser Ser Gly Met 
210 215 220 



Met Met Val Ala Met Arg His Leu Glu Gly He Ala Arg Pro Lys Gly 
^^^5 230 235 

Gly Thr Gly Ala Leu Thr Glu Ala Leu Val Lys Leu Val Gin Ala Gin 
245 250 255 . 



Gly Gly Lys lie Leu Thr Asp Gin 
260 



Asn Asn Gin Ala He Gly Val Glu 
275 280 




Ala Lys Lys Gly Val He Ser Asn 
290 295 



Gin Leu Val Glu Pro Gly Ala Leu 
•305 ■ 310 

Glu Arg Leu Glu Arg Arg Thr Val 
325 



He Asp Cys Ala Leu Ser Gly Leu 



Thr Val Lys Arg Val Leu Val Glu 
265 270 



Val Ala Asn Gly Glu Gin Tyr Arg 
285 

He Asp Ala Arg Arg Leu Phe Leu 
.300 



Ala Lys Val Asn Gin Asn Leu Gly 
315 320 



Asn Asn Asn Glu Ala He Leu Lys 
330 335 



Pro His Phe Thr Ala Met Ala Gly 
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340 



345 



350 



Pro Glu Asp Leu Thr Gly Thr lie Leu He Ala Asp Ser Val Arg His 
355 360 365 . 



Val Glu Glu Ala His Ala Leu He Ala Leu Gly Gin He Pro Asp Ala 
370 375 380 



Asn Pro Ser Leu Tyr Leu Asp He Pro Thr Val Leu Asp Pro Thr Met 
5 390 395 400 



Ala Pro Pro Gly Gin His Thr Leu.Trp He Glu Phe Phe Ala Pro Tyr 
405 410 415 



Arg He Ala Gly Leu Glu Gly Thr Gly lieu Met Gly Thr Gly Trp Thr 
420 425 430 



Asp Glu Leu Lys Glu Lys Val , Ala Asp Arg Val He Asp Lys Leu Thr 
435 440 445 



;p Tyr Ala Pro Asn Leu Lys Ser Leu He He Gly Arg Arg Val Glu 
450 * 455 460 



Ser Pro Ala .Glu Leu Ala Gin Arg Leu Gly Ser Tyr Asn Gly Asn Val 
465 470 475 480 



Tyr His Leu Asp Met Ser Leu Asp Gin Met Met Phe Leu- Arg Pro Leu 
485 490 495 



Pro Glu He Ala Asn Tyr Gin Thr Pro lie Lys Asn Leu Tyr Leu Thr 
500 505 510 
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Gly Ala Gly Thr His Pro Gly Gly Ser lie Ser Gly Met Pro Gly Arg 
515 520 525 



Asn Cys Ala Arg Val Phe Leu Lys Gin' Gin Arg Arg Phe Trp 
530 535 540 



<210> 23 
_<211> 776 
12> DNA 




<213> Bradyrhizotiium sp. 



<220> 



<221> " CDS 



<222> (1) . . (774) 



<223> 




48 



96 



<400> 23 

atg cat gca gca acc gcc* aag get act gag ttc ggg gee tct egg cgc 
Met His Ala Ala Thr Ala Lys Ala Thr Glu Phe Gly Ala Ser Arg Arg 
! 5 10 15 

gac gat gcg agg cag cgc cgc gtc ggt etc acg ctg gcc gcg gtc ate 

Asp Asp Ala Arg Gin Arg Arg Val Gly Leu Thr Leu Ala Ala Val lie 
20. 25 30 

ate gcc gcc tgg ctg gtg ctg cat gtc ggt ctg atg ttc ttc tgg ccg 144 
lie Ala Ala Trp Leu Val Leu His Val Gly Leu Met Phe Phe Trp Pro 
35 40 45 
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ctg acc ctt cac age ctg ctg ccg get ttg cct ctg gtg gtg ctg cag 
Leu Thr Leu His Ser Leu Leu Pro Ala Leu Pro Leu Val Val Leu Gin 
50 55 60 

acc tgg etc tat gta ggc ctg ttc ate ate gcg cat gac tgc atg cac 
Thr Trp Leu Tyr Val Gly Leu Phe lie He Ala His Asp Cys Met His 
65 .70 75 80 

ggc teg ctg gtg ccg ttc aag ccg cag gtc aac cgc cgt ate gga cag 
Gly Ser Leu Val Pro Phe Lys Pro Gin Val Asn Arg Arg He Gly Gin 
85 90 95 



192 



» 



k c tgc ctg ttc etc tat gee ggg ttc tec ttc gac get etc aat gtc 
Cys Leu Phe Leu Tyr Ala Gly Phe Ser Phe Asp Ala Leu Asn Val 
100 105 . HO 




ttc ctg cac tat ttc ggc tgg aag cag gtc gcg ate ate gea gec gtc 

e Leu His Tyr Phe Gly Trp Lys Gin Val Ala He He Ala Ala Val 
145 150 155 ' 160 

teg ctg gtt tat cag etc gtc ttc gec gtt ccc ttg cag aac ate ctg 
Ser Leu Val Tyr Gin Leu Val Phe Ala Val Pro Leu Gin Asn lie Leu 
165 170 175 

ctg ttc tgg gcg ctg ccc ggg ctg ctg teg gcg ctg cag ctg ttc acc 
Leu Phe Trp Ala Leu Pro Gly Leu Leu Ser Ala Leu Gin Leu Phe Thr 
180 185 190 



240 



288 



336 



384 



gag cac cac aag cat cac cgc cat ccc ggc acg gec gag gat ccc gat 
Glu His His Lys His His Arg His Pro Gly Thr Ala Glu Asp Pro Asp 
115 120 125 

ttc gac gag gtg ccg ccg cac ggc ttc tgg cac tgg ttc gee age ttt 432 
Phe Asp Glu Val Pro Pro His Gly Phe Trp His Trp Phe Ala Ser Phe 
130 135 140 



480 



528 



576 



ttc ggc acc tat ctg ccg cac aag ccg gee acg cag ccc ttc gee gat 
Phe Gly Thr Tyr Leu Pro His Lys Pro Ala Thr Gin Pro Phe Ala Asp 
195 200 .205 



624 
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cgc cac aac gcg egg acg age gaa ttt ccc gcg tgg ctg.tcg ctg ctg 
Arg His Asn Ala Arg Thr- Ser Glu Phe Pro Ala Trp Leu Ser Leu Leu 
210 215 220 

ace tgc ttc cac tfcc ggc ttt cat cac gag cat cat ctg cat ccc gat 
Thr Cys Phe His Phe Gly Phe His His Glu His His Leu His Pro Asp 
225 230 235 240 

gcg ccg tgg tgg egg ctg ccg gag ate aag egg egg gee ctg gaa agg 
Ala Pro Trp Trp Arg Leu Pro Glu lie Lys Arg Arg Ala Leu Glu Arg 
245 250 255 



gac ta 
r g Asp 




672 



720 



768 



776 



<210> 24 
<211> 258 . 

<212> PRT 

<213> • Bradyrhizobium sp. 



0> 24 



Met His Ala Ala Thr Ala Lys Ala Thr Glu Phe Gly Ala Ser Arg Arg 
i 5 10 15 



Asp Asp Ala Arg Gin Arg Arg Val Gly Leu Thr Leu Ala Ala Val He 
20 25 30 • 



He Ala Ala Trp Leu Val Leu His Val Gly Leu Met Phe Phe Trp Pro 
35 40 45 



• Leu Thr Leu His Ser Leu Leu Pro Ala Leu Pro Leu Val Val Leu Gin 
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50 



55 



60 



Thr Trp Leu Tyr Val Gly Leu Phe lie lie Ala His. Asp Cys Met His 
65 70 75 80 



Gly Ser Leu Val Pro Phe Lys Pro Gin Val Asn Arg Arg He Gly Gin 
85 90 95 



Leu Cys Leu Phe Leu Tyr Ala Gly Phe Ser Phe Asp Ala Leu Asn .Val 
100 105 HO 



lu His His Lys His His Arg JEiis Pro Gly Thr Ala Glu Asp Pro Asp 
115 120 ' 125 



Phe Asp Glu Val Pro Pro His Gly Phe Trp His Trp Phe Ala Ser Phe 
130 135 140 



Phe Leu His Tyr Phe Gly Trp Lys Gin Val Ala" He He Ala Ala Val 
145 • 150' 155 160 




Leu Val Tyr Gin Leu Val Phe Ala Val Pro Leu Gin Asn He Leu 
165 170 175 



Leu Phe Trp Ala Leu Pro Gly Leu Leu Ser Ala Leu Gin Leu - Phe Thr 
180 185 190 



Phe Gly Thr Tyr Leu Pro His Lys Pro Ala Thr Gin Pro Phe Ala Asp 
195 ' 200 205 



Arg His Asn Ala Arg Thr Ser Glu Phe Pro Ala Trp Leu Ser Leu Leu 
210 215 220 
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Thr Cys Plie His Phe Gly Phe His His Glu His His Leu His Pro Asp 
225 230 -235 240 



Ala Pro Trp Trp.Arg Leu Pro Glu lie Lys Arg Arg Ala Leu Glu Arg 
245 250 255 



Arg Asp 




<210> 25 



<211> 777 



<212> DNA 



<213> Nostoc sp. 



» 



<220> 

21> CDS 



<222> (1) . . (777) 
<223> . 



<400> 25 

atg gtt cag tgt caa cca tea tct ctg cat tea gaa aaa ctg gtg tta 48 

Met Val Gin Cys Gin Pro Ser Ser Leu His Ser Glu Lys Leu Val Leu 

1 5 10 15 

ttg tea teg aca ate aga gat gat aaa aat att aat aag ggt ata ttt 96 
Leu Ser Ser Thr He Arg Asp Asp Lys Asn He Asn Lys Gly He Phe 
20 25 30 
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att gcc tgc ttt ate tta ttt tta tgg gca att agt tta ate tta tta 
lie Ala Cys Plae He Leu Phe Leu Trp Ala He Ser Leu He Leu Leu 
35 40 45 

etc tea ata gat aca tec ata att cat aag age tta tta ggt ata gcc 
Leu Ser He Asp Thr Ser He He His Lys Ser Leu Leu Gly He Ala 
50 55 ■ 60 

atg ctt tgg cag ace ttc tta tat aca ggt * tta ttt att act get cat 
Met Leu Trp Gin Thr Phe Leu Tyr Thr Gly Leu' Phe He Thr Ala His 
65 70 75 80 



gcc atg cac ggc gta gtt tat ccc aaa aat ccc aga ata aat aat 
!p Ala Met His Gly Val Val Tyr Pro Lys Asn Pro Arg He Asn Asn 
85 90 95 




144 



192 



240 



28S 



ttt. ata ggt aag etc act eta ate ttg tat gga eta etc cct tat aaa 
Phe He Gly Lys Leu Thr Leu lie Leu Tyr Gly Leu Leu Pro Tyr Lys 
100 105 110 

gat tta ttg aaa aaa cat tgg tta cac cac gga cat cct ggt act gat 
Asp Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp 
115 120 125 

tta gac cct gat tat tac aat ggt cat ccc caa aac ttc ttt ctt tgg 
u Asp Pro Asp Tyr- Tyr Asn Gly His Pro Gin Asn Phe Phe Leu Trp 
130 135 ' 140 

tat eta cat ttt atg aag tct tat tgg. cga tgg acg caa att ttc gga 
Tyr Leu His Phe Met Lys Ser Tyr Trp Arg Trp Thr -Gin He Phe Gly n 
145 150 155 160 

tta gtg atg att ttt cat gga ctt aaa aat ctg gtg cat ata cca gaa ♦ 
Leu Val Met He Phe His Gly Leu Lys Asn Leu Val His He Pro Glu 
165 ' 170 175 



336 



384 



432 



480 



528 



aat aat tta att ata ttt tgg atg ata cct tct att tta agt tea gta 
Asn Asn Leu -He He Phe Trp Met He Pro Ser He Leu Ser Ser Val 
180 185 190 



576 
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caa eta ttt tat ttt ggt aca ttt ttg cct cat aaa aag eta gaa ggt 624 
Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys Lys Leu Glu Gly 
195 200 . 205 



ggt tat act aac ccc cat tgt gcg cgc agt ate cca tta cct ctt ttt 
Gly Tyr Thr Asn Pro His Cys Ala Arg Ser lie Pro Leu Pro Leu Phe 
210 215 .220 

tgg tct ttt gtt act tgt tat cac ttc ggc tac cac aag gaa cat cac 
Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His 
225 230 235 240 



gaa 

w 



672 



720 



aa tac cct caa ctt cct tgg tgg aaa tta cct gaa get cac aaa ata 7 68 

Tyr Pro Gin Leu Pro Trp Trp Lys Leu Pro Glu Ala His Lys lie 
245 • 250 255 



tct tta taa 
Ser Leu 



777 



<210> 26 



<211> 258 



<212> PRT 




13> Nostoc sp. 



<400> 26 



Met Val Gin Cys Gin Pro Ser Ser Leu His Ser Glu Lys Leu Val Leu 
1 5 .10 .15 



Leu Ser Ser Thr He Arg Asp Asp Lys Asn He Asn Lys Gly He Phe 
20 25 30 

He Ala Cys Phe He Leu Phe Leu Trp Ala He Ser Leu He Leu Leu 
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35 40 45 



Leu Ser lie Asp Thr Ser lie lie 
50 55 



Met Leu Trp Gin Thr Phe Leu Tyr 
65 70 

Asp Ala Met His Gly Val Val Tyr 
85 

Phe He Gly Lys Leu Thr Leu He 
100 



Asp Leu Leu Lys Lys His Trp Leu 
115 120 



His Lys Ser Leu Leu Gly He Ala 
60 



Thr Gly Leu Phe lie Thr Ala His 
75 80 



Pro Lys Asn Pro Arg He Asn Asn 
. 90 95 



Leu Tyr Gly Leu Leu Pro Tyr Lys 
105 HO 



His His Gly His Pro Gly Thr Asp 
125 



Leu Asp Pro Asp Tyr Tyr Asn Gly His Pro Gin Asn Phe Phe Leu Trp 
130 135 140 

Leu His Phe Met Lys Ser Tyr Trp Arg Trp Thr Gin He Phe Gly 
145 150 155 160 



Leu Val Met He Phe His Gly Leu Lys Asn Leu Val His He Pro Glu 
165 170 175 



Asn Asn Leu He He Phe Trp Met He Pro Ser He Leu Ser Ser Val . 
180 185 190 



Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys Lys Leu Glu Gly 
195 . 200 ' 205 
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Gly Tyr Thr Asn Pro His Cys Ala Arg Ser lie Pro Leu Pro Leu Phe 
210 215 " " ' 220 



Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His 
225 230 235 240 



Glu Tyr Pro Gin Leu Pro Trp Trp Lys Leu Pro Glu Ala His Lys He 
245 250 255 



r Leu 





<210> 27 

<211> 789 

<212> DNA 

<213> Nostoc puncti forme 



20> 



<221> CDS 

<222> (1). .(789) 

<223> 



<400> 27 

ttg aat ttt tgt gat aaa cca gtt age tat tat gtt gca ata gag caa 
Leu Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala He Glu Gin 
1 5 10 15 
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tta agt get aaa gaa gat act gtt tgg. ggg ctg gtg att gtc ata gta 96 

Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu' Val He Val He Val 

20 • 25 30 

att att agt ctt tgg gta get agt ttg get ttt tta eta get att aat ' 144 
He lie Ser Leu Trp Val Ala- Ser Leu Ala Phe Leu Leu Ala lie Asn 
35 40 45 

tat gec aaa gtc cca att tgg ttg ata cct att gca'ata gtt tgg caa • 192 
Tyr Ala Lys Val Pro He Trp Leu lie Pro lie Ala He Val Trp Gin 
50 55 60 

atg ttc ctt tat aca ggg eta ttt att act gca cat gat get atg cat 240 
f: Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His Asp Ala Met His 

70 75 BO 

ggg tea gtt tat cgt aaa aat ccc aaa att aat aat ttt ate ggt tea 2 88 

Gly Ser Val Tyr Arg Lys Asn Pro Lys He Asn Asn Phe He Gly Ser 
.85 * 90 -95 

eta get gta gcg ctt tac get gtg ttt cca tat caa cag atg tta aag 3 3-6 

Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gin Gin Met Leu Lys 
100 105 110 

aat cat tgc tta cat .cat cgt cat cct get age gaa gtt gac cca gat 3 84 

Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp 
115 120 125 

ttt cat gat ggt aag aga aca aac get att ttc tgg tat etc cat ttc 432 
Phe. His Asp Gly Lys Arg Thr Asn Ala. He Phe Trp Tyr Leu His Phe 
130 135 140 

atg ata gaa. tac tec agt tgg caa cag tta ata gta eta act ate eta 480 
Met He Glu Tyr Ser Ser Trp Gin Gin Leu - He Val Leu Thr He Leu 
145 150 155 160 

ttt aat tta get aaa tac gtt ttg cac ate cat caa ata aat etc ate 528 
Phe Asn Leu Ala. Lys Tyr Val Leu His He Hi's Gin He Asn Leu He 
165 170 175 




tta ttt tgg agt att cct cca att tta agt tec att caa ctg ttt tat 



576 
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Leu Phe Trp Ser lie Pro Pro He Leu Ser Ser He Gin Leu Plie- Tyr 
180 185 190 

ttc gga aca ttt ttg cat cat cga gaa ccc aag aaa gga 'tat gtt tat 624 
Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr 
195 200 . 205 

ccc cat tgc age caa aca ata aaa ttg cca act ttt ttg tea ttt ate 672 
Pro His Cys Ser Gin Thx He Lys Leu Pro Thr Phe Leu Ser Phe He 
210 215 220 

get tgc tac cac ttt ggt tat cat gaa gaa cat cat gag tat ccc cat 720 
Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 

230 235 240 



gta cct tgg tgg caa ctt cca tct gta tat aag cag aga gta. ttc aac 7 68 

Val Pro Trp Trp Gin Leu Pro Ser Val Tyr Lys Gin Arg Val Phe Asn 
245 250 . ' 255 

aat tea gta acc aat teg taa 7 89 

Asn Ser Val Thr Asn Ser 
260 



<210> 28 

^^^11> 262 

*212> PRT 

<213> Nostoc punctiforme 

<400> 28 

Leu Asn. Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala He Glu Gin 
1.5 10 15 

Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val He Val He Val 
20 25 30 
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He He Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala He Asn 
35 40 45 



Tyr Ala Lys Val Pro He Trp Leu He Pro He Ala He Val Trp Gin 
50 55 60 



Met Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His Asp Ala Met His 
65 70 75 80 

• Ser Val Tyr Arg Lys Asn Pro Lys He Asn Asn Phe He Gly Ser ; 
85 90 ' 95 



Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gin Gin Met Leu Lys 
100 105 110 



Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp 
115 120 ■. 125 




Phe His Asp Gly Lys Arg Thr Asn Ala He Phe Trp Tyr Leu His Phe 
130 135 140 



Met He Glu Tyr Ser Ser Trp Gin Gin Leu He Val Leu Thr He Leu 
145 150 155 160 



Phe Asn Leu Ala Lys Tyr Val Leu His He His Gin He Asn Leu He 
165 170 175 



Leu Phe Trp Ser He Pro Pro He Leu Ser Ser He Gin Leu Phe Tyr 
180 185 190 
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Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr 
195 200 205 



Pro His Cys Ser Gin Thr lie Lys Leu Pro Thr Phe Leu Ser Phe lie 

210 2.15 220 • 

Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 

225 230 235 240 



Val Pro Trp Trp Gin Leu Pro Ser Val Tyr Lys Gin Arg Val Phe Asn 
245 250 255 

Asn Ser Val Thr Asn Ser 
260 

<210> 29 
<211> 762 
<212> DNA 
^^^^13> Nostoc punctiforme 

<220> 

<221> CDS 

<222> (1)..(762) 

<223> 

<400> 29 

gtg ate cag tta gaa caa cca etc agt cat caa gca aaa ctg act cca 
Val lie Gin Leu Glu Gin Pro Leu Ser His Gin Ala Lys Leu Thr * Pro 



BASF AG 60/68 4.September 2003 

BASF NAE 597/03 

1 '5 10 15 

gta ctg aga agt aaa tct cag ttt aag ggg ctt ttc att get att gtc 96 
Val Leu Arg Ser Lys Ser Gin Phe Lys Gly Leu Phe lie Ala lie Val 
20 25 30 

att gtt age gca tgg gtc att age ctg agt tta tta ctt tec ctt gac 144 
lie Val Ser Ala Trp Val lie Ser- Leu Ser Leu Leu Leu Ser Leu Asp 
35 40 45 

ate tea aag eta aaa ttt tgg atg tta ttg cct gtt ata eta tgg caa 192 
lie Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val lie Leu Trp Gin 
50 55 60 

a ttt tta tat acg gga tta" ttt att aca tct cat gat gec atg cat 2 40 

Thr Phe Leu Tyr Thr Gly Leu Phe lie Thr Ser His Asp Ala Met His 
65 70 75 80 

ggc gta gta ttt ccc caa aacacc aag att aat cat ttg. att gga aca 2 88 

Gly Val Val Phe Pro Gin Asn Thr Lys lie Asn His Leu He Gly Thr 
85 90 95 

ttg acc eta tec ctt tat ggt ctt tta cca tat caa aaa eta ttg aaa 336 
Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr ,Gln Lys .Leu Leu Lys 
100 105 110 




a cat tgg tta cac cac cac aat cca gca age tea ata gac ccg gat 3 84 

s His Trp Leu His His His Asn Pro Ala Ser Ser lie Asp Pro Asp 
115 120 125 



ttt cac aat ggt aaa cac caa agt ttc ttt get tgg tat ttt cat ttt 432 
Phe His Asn Gly Lys His Gin Ser Phe Phe Ala Trp Tyr Phe His Phe 
130 135 140 

atg aaa ggt tac' tgg agt tgg. ggg caa ata att gcg ttg act att att 480 
Met Lys Gly Tyr Trp Ser Trp Gly Gin He He Ala Leu Thr He He 
145 150 155 160 



tat aac ttt . get aaa tac ata etc cat ate cca agt gat aat eta act 
Tyr Asn Phe Ala Lys Tyr He Leu His lie Pro Ser Asp Asn Leu Thr 
165 170 175 



528 
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tac ttt tgg gtg eta ccc teg ctt tta agt tea tta caa tta ttc tat 5 76 

Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gin Leu Phe Tyr 

180 185 • 190 

ttt ggt act ttt tta ccc cat agt gaa cca ata ggg ggt tat gtt cag 624 

Phe Gly Thr Phe Leu Pro His Ser Glu Pro lie Gly Gly . Tyr Val Gin 

195 200 205 

cct cat tgt gec caa aca att age cgt cct att tgg tgg tea ttt ate 672 

Pro His Cys Ala Gin Thr lie Ser Arg Pro lie Trp Trp Ser Phe lie 

210- 215 220 



acg tgc tat cat ttt ggc tac cac gag gaa cat cac gaa tat cct cat 
Cys Tyr His Phe Gly Tyr His. Glu Glu His His Glu Tyr Pro His 
230 235 240 




720 



att tct tgg tgg cag tta cca gaa att tac aaa gca aaa tag 
lie Ser Trp Trp Gin Leu Pro Glu lie Tyr Lys Ala Lys 
245 250 



762 



<210> 30 

<211> 253 

<212> PRT 

^jl^L3> Nostoc punctiforme 

<4O0> 30 

•Val lie Gin Leu Glu Gin Pro Leu' Ser His Gin Ala Lys Leu Thr Pro 

1 • 5 -10 .15 



Val Leu Arg Ser Lys Ser Gin Phe Lys .Gly Leu Phe lie Ala He Val 
20 25 30 
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lie Val.Ser Ala Trp Val lie Ser Leu Ser Leu Leu Leu Ser Leu Asp 
- 35 40 45 



lie Ser Lys Leu' Lys Phe Trp Met Leu Leu Pro Val lie Leu Trp Gin 
50 55 60 



Thr Phe Leu Tyr Thr Gly Leu Phe lie Thr Ser His Asp Ala Met His 
65 70 . 75 80 

Gly Val Val Phe Pro Gin Asn Thr Lys lie Asn His Leu lie Gly Thr 




Leu Thr Leu Ser ' Leu Tyr Gly Leu Leu Pro Tyr Gin Lys Leu Leu Lys 
100 105 110- 



Lys His Trp Leu His His His Asn Pro Ala Ser Ser lie Asp Pro Asp 
115 120 . 125 



Phe His Asn Gly Lys His Gin Ser Phe Phe Ala Trp Tyr Phe His Phe 
■ 130 • : 135 140 



et Lys Gly Tyr Trp Ser Trp Gly Gin lie lie Ala Leu Thr lie lie 
145 ' 150 . 155 160 



Tyr Asn Phe Ala Lys Tyr lie Leu His lie Pro Ser Asp Asn Leu Thr 
165 170 175 



Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gin Leu Phe Tyr 
180 185 190 



Phe Gly Thr. Phe Leu Pro His Ser Glu Pro He' Gly Gly Tyr Val Gin 
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195 .200 ' 205 



Pro His Cys Ala Gin Thr He Ser Arg Pro lie Trp Trp Ser Phe He 
210 215 220 * 



Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
225 230 235 ■ 240 



He Ser Trp Trp Gin Leu Pro Glu He Tyr Lys Ala Lys 
245 250 



10> 31 

<211> 1608 

<212> DNA 

<213> Haematococcus pluvialis 
<220> 



£221>' CDS 

22> (3).. (971). 



<223> 



<40.0> 31 

ct aca ttt cac aag ccc gtg age ggt gca age get ctg ccc cac ate 

Thr Phe His Lys Pro.Val Ser Gly Ala Ser Ala Leu Pro His He 
1 . 5 10 15 

ggc cca cct cct cat etc cat egg tea ttt get get ace acg atg ctg 
Gly Pro Pro Pro His Leu His Arg Ser Phe Ala Ala Thr Thr Met Leu 
20 ' 25 30 ' 
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teg aag ctg cag tea ate age gtc aag gec cgc cgc gtt gaa eta gec 143 

Ser Lys Leu Gin Ser lie Sex Val Lys Ala Arg Arg Val Glu Leu Ala 
35 40 - 45 

cgc gac ate acg egg ccc aaa gtc tgc ctg cat get cag egg tgc teg 191 

Arg Asp He Thr Arg Pro Lys Val Cys Leu His Ala Gin Arg Cys Ser 
50 .55 60 

tta gtt egg ctg cga gtg gca gca cca cag aca gag gag gcg ctg gga 239 

Leu Val Arg Leu Arg Val Ala Ala Pro Gin Thr Glu Glu Ala Leu Gly 
65 70 75 



cc gtg cag get gec ggc gcg ggc gat gag cac age gee gat gta gca 2 87 

Val Gin Ala Ala Gly Ala. Gly Asp Glu His Ser Ala Asp Val Ala 
0 85 • 90 95 



etc cag cag ctt gac egg get ate gca gag cgt cgt gec egg cgc aaa 335 
Leu Gin Gin Leu Asp Arg Ala He Ala Glu Arg Arg Ala Arg Arg Lys 
100 105 110 

egg gag cag ctg tea tac cag get gec gee att gca gca tea att ggc 3 83 

Arg Glu Gin Leu Ser Tyr Gin Ala Ala Ala He Ala Ala Ser He Gly 
115 120 125 



gtg tea ggc att gec ate ttc gee acc tac ctg aga ttt gecatg cac 431 
jal Ser Gly He Ala He Phe Ala Thr Tyr Leu Arg Phe Ala Met His 
130 ■ 135 140 



atg acc gtg ggc ggc gca gtg cca tgg ggt gaa gtg get ggc act etc 479 
Met Thr Val Gly Gly Ala Val Pro Trp Gly Glu Val Ala Gly Thr Leu 
145 • 150 155 ' 

etc ttg gtg gtt ggt ggc gcg etc ggc atg gag atg tat gec cgc tat 527 
Leu Leu Val Val ' Gly Gly Ala Leu Gly Met Glu Met' Tyr Ala Arg Tyr 
160 165 170 175 

gca cac aaa gec ■ ate tgg cat gag teg cct ctg ggc tgg ctg ctg cac 575 
Ala His Lys Ala He Trp His Glu Ser Pro Leu Gly Trp Leu Leu His 
180 185 190 
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aag age cac cac aca cct cgc act' gga ccc ttt gaa gec aac gac ttg 623 
Lys Ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu 
195 200 205 

ttt gca ate atc aat gga ctg ccc gec atg etc ctg tgt acc ttt ggc 671 
Phe Ala lie lie Asn Gly Leu Pro Ala Met Leu Leu Cys Thr Phe Gly 
210 215 220 ' 

ttc tgg ctg ccc aac gtc ctg ggg gcg gee tgc ttt gga gcg ggg ctg 719 
Phe Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly Ala Gly Leu 
225 230 235 



ggc ate acg eta tac ggc atg gca tat atg ttt gta cac gat ggc ctg 7 67 

ly lie Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu 

245 250 ' 255 



gtg cac agg cgc ttt ccc .acc ggg ccc ate get ggc ctg ccc tac atg 815 
Val His Arg Arg Phe Pro Thr Gly Pro He Ala Gly Leu Pro Tyr Met 
260 265 * 270 

aag cgc ctg aca gtg gec cac cag eta cac cac age ggc aag tac ggt .8 63 

Lys Arg Leu Thr Val Ala His Gin Leu His His Ser Gly Lys Tyr Gly 
275 280 285 

ggc gcg ccc tgg ggt atg ttc ttg ggt cca cag gag ctg cag cac att 911 
Gly Ala Pro Trp Gly Met Phe Leu Gly Pro Gin Glu Leu Gin His He 
290 295 300 

■a .ggt gcg gcg gag gag gtg gag cga ctg gtc ctg gaa ctg gac tgg 9 59 

Pro Gly Ala Ala Glu Glu Val Glu Arg Leu Val Leu Glu Leu Asp Trp 
305- 310 315 

tec aag egg tag ggtgcggaac caggcacgct ggtttcacac ctcatgcctg 1011 

Ser Lys Arg 

320 

tgataaggtg tggctagagc gatgcgtgtg agaegggtat gtcaeggteg actggtctga 1071 

tggccaatgg catcggccat gtctggtcat caegggctgg ttgcctgggt gaaggtgatg 1131 

cacatcatca tgtgcggttg gaggggctgg cacagtgtgg gctgaactgg agcagttgtc il91 
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caggctggcg ttgaatcagt gagggtttgt gattggcggt tgtgaagcaa tgactccgcc 12 51 

catattctat ttgtgggagc tgagatgatg gcatgcttgg gatgtgcatg gatcatggta 1311 

gtgcagcaaa ctatattcac ctagggctgt tggtaggatc aggtgaggcc ttgcacatfcg 1371 

catgatgtac tcgtcatggt gtgt'tggtga gaggatggat gtggatggat gtgtattctc 1431 

agacgtagac cttgactgga ggcttgatcg agagagtggg ccgtattctt tgagagggga ' 1491 

ggctcgtgcc agaaatggtg agtggatgac .tgtgacgctg tacattgcag gcaggtgaga 1551 

actgtct cgattgtaaa atacattcag atgcaaaaaa aaaaaaaaaa aaaaaaa 1608 

<210> 32 

<211> 322 . 

<212> PUT 

<213> Haematococcus pluvialis 




00> 32 



*hr Phe His Lys Pro Val Ser Gly Ala Ser Ala Leu Pro His lie Gly 
1-5 10 15 



Pro Pro Pro His Leu His Arg Ser Phe Ala Ala Thr Thr Met Leu Ser 
20 25 30 



Lys Leu Gin Ser lie Ser Val Lys Ala Arg Arg Val Glu Leu Ala Arg 
35 40 45 



Asp lie Thr Arg Pro Lys Val Cys Leu His Ala Gin Arg Cys Ser Leu 
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50 55 60 



Val Arg Leu Arg Val Ala Ala Pro Gin Thr Glu Glu* Ala Leu Gly Thr 
65 70 75 80 

Val Gin Ala Ala Gly Ala Gly Asp Glu His Ser Ala Asp Val Ala Leu 
85-90 95 



Gin Gin Leu Asp Arg Ala lie Ala Glu Arg Arg Ala Arg Arg Lys Arg 
100 , 105 110 



lu Gin Leu Ser Tyr Gin Ala Ala Ala lie Ala Ala Ser He Gly Val 
115 120 125 



Ser Gly He Ala He Phe Ala Thr Tyr Leu Arg Phe Ala Met His Met 
130 135 140 



Thr Val Gly Gly Ala Val Pro Trp Gly Glu Val Ala Gly Thr Leu Leu 
•145 150 155 160 



Val Val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala Arg- Tyr Ala 
165 . 170 175 



His Lys Ala lie Trp His Glu Ser Pro Leu Gly Trp Leu Leu His Lys 
180 185 190 



Ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu Phe 
195 200 205 



Ala He He Asn Gly Leu Pro Ala Met Leu Leu Cys Thr Phe Gly Phe 
210 ' 215 220 
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Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly Ala Gly Leu Gly 
225 230 235 . 240 



lie Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu Val 
245 250 * 255 



His Afg Arg Phe Pro Thr Gly Pro He Ala Gly Leu Pro Tyr Met Lys 
260 265 270 



Leu Thr Val Ala His Gin Leu His His Ser Gly Lys Tyr Gly Gly 
275 280 285 



Ala Pro Trp Gly Met .Phe Leu Gly Pro Gin Glu Leu Gin His lie Pro 
290 2.95 300 



Gly Ala Ala Glu Glu Val. Glu Arg Leu Val Leu Glu Leu Asp Trp Ser 
305' 310 - 315 320 



